Завершен
2024 / 2025

2118 Анализ производительности параллельных кодов, использующих технологию GPU-aware MPI, на суперкомпьютере Десмос
Старт
22.01.2025
Представление
27.01.2025 – 07.02.2025
Постерная сессия
14.04.2025 – 25.04.2025
Защита
13.05.2025 – 19.05.2025
Паспорт проекта
Аннотация
Увеличение производительности суперкомпьютерных систем в наступившую пост-Муровскую эру обеспечивается за счёт роста числа узлов, процессорных и графических ядер. Этот рост приводит к необходимости эффективной коммуникации в задачах с интенсивным обменом данными между узлами, что способствует совершенствованию и появлению новых высокоскоростных коммуникационных сетей и моделей межпроцессорного взаимодействия.
Модель Message-Passing Interface (MPI) в высокопроизводительных вычислениях является...
Отрасль
Автоматика. Вычислительная техника
Теги
Суперкомпьютеры
Интерконнект
Вычисления
Моделирование
Цель
Провести оценочное тестирование технологии GPU-aware MPI для высокоскоростной коммуникационной сети Ангара, а также оценить и сравнить данную технологию на различных параллельных кодах с аналогичной технологией для сети InfiniBand FDR на суперкомпьютере Десмос с одинаковым вычислительным окружением. По итогам сравнений сделать выводы о применимости разных кодов для конкретного типа сети со своей реализацией GPU-aware MPI.
Ожидаемые результаты
- Провести детальный анализ принципов работы технологии GPU-aware MPI, основанной на программном модуле UCX RDMA, для сети Ангара.
- Сравнить при помощи бенчмарков OSU коммуникации точка-точка для Ангары и Infiniband FDR.
- Оценить производительность бенчмарка rocHPL для Ангары и сравнить её с аналогичной производительностью для InfiniBand FDR на суперкомпьютере Десмос.
Форма и способы промежуточного контроля
Еженедельные встречи.
Форма представления результатов
Отчёты, статьи, доклады на конференциях.
Ресурсное обеспечение
Суперкомпьютер Десмос в ОИВТ РАН с 32 гибридными вычислительными узлами и необходимым программным окружением. Суперкомпьютер Харизма НИУ ВШЭ.
Имеющийся задел
Протестированный бенчмарк rocHPL для сетей InfiniBand FDR и Ангара. Освоен протокол работы с инфраструктурой Score-P. Первые результаты представлены Феликсом Смирновым в виде устных докладов на международной конференции Parallel Processing and Applied Mathematics PPAM-2024 и международной конференции Russian Supercomputing Days RSD-2024.
Заказчик
МИЭМ / ДПМ