Завершен
2021 / 2022

1017 Разработка подсистемы анализа данных для системы “HPC TaskMaster” суперкомпьютера «cHARISMa» НИУ ВШЭ
Старт
15.01.2022
Представление
28.01.2022
Постерная сессия
18.04.2022
Защита
06.06.2022
Паспорт проекта
Аннотация
Данный проект посвящен разработке подсистемы анализа данных для программной системы HPC TaskMaster для суперкомпьютера cHARISMa НИУ ВШЭ. Система автоматически определяет неэффективно запущенные задачи на суперкомпьютере. Первая версия уже HPC TaskMaster уже запущена в производственную эксплуатацию, однако, ей все еще требуется дополнительная работа: доработка существующих способов сбора и анализа временных рядов, разработка нового функционала, написание развернутой проектной документации.
Отрасль
Информатика
Теги
Информатика
Цель
Разработка подсистемы анализа данных для системы HPC TaskMaster для суперкомпьютера «cHARISMa» НИУ ВШЭ
Ожидаемые результаты
- Разработана и внедрена в производственную эксплуатацию подсистема выводов для задач, позволяющая автоматически формировать вывод об эффективности работы задачи. Сами типы выводов должны формироваться администратором.
- Разработаны новые индикаторы для определения проблем с использованием файловой системы, оперативной памяти, сети InfiniBand.
- Разработана система оповещения пользователей о запуске ими неэффективных задач.
- Несколько публикаций о системе HPC TaskMaster.
Форма и способы промежуточного контроля
Регулярные консультации с руководителем проекта.
Отчеты.
Форма представления результатов
Отчёт, презентация и web-приложение
Ресурсное обеспечение
Доступ к суперкомпьютеру «cHARISMa» НИУ ВШЭ
Имеющийся задел
Прототип системы.
Заказчик
НИУ ВШЭ / Отдел суперкомпьютерного моделирования НИУ ВШЭ