Завершен
2023 / 2024

1572 Расширение подсистемы анализа данных для программной системы HPC TaskMaster
Старт
11.09.2023
Представление
09.11.2023
Постерная сессия
27.01.2024 – 07.02.2024
Защита
15.04.2024
Паспорт проекта
Аннотация
«HPC TaskMaster» - система мониторинга эффективности задач суперкомпьютера, разработанная отделом суперкомпьютерного моделирования НИУ ВШЭ. В системе есть несколько подсистем: подсистема подсчета статистики пользователей, подсистема автоматической рассылки, подсистема получения и обработки метрик, подсистема выводов и подсистема анализа данных о задачах. Данный проект посвящен расширению подсистемы анализа данных для выявления новых типов ошибок при запуске задач пользователей, что приведет к...
Отрасль
Информатика
Теги
Информатика
Цель
Расширение подсистемы анализа данных для программной системы «HPC TaskMaster» суперкомпьютерного комплекса «cHARISMa» НИУ ВШЭ
Ожидаемые результаты
- • Разработано приветственное обучение для новых пользователей (онбординг) системы.
- • Разработан веб-интерфейс для настройки приоритетов выводов об эффективности вычислительных задач.
- • Разработаны новые индикаторы, теги и выводы.
- • Подсистема анализа расширена параметрами
- • Подсистема выводов расширена наборами диапазонов параметров.
- • Написана статья для научной конференции «Параллельные вычислительные технологии» на английском языке.
Форма и способы промежуточного контроля
Регулярные консультации с руководителем проекта.
Форма представления результатов
* Исходный код.
* Отчёт, презентация, проморолик.
* Публичная защита проекта перед комиссией
Ресурсное обеспечение
Доступ к суперкомпьютеру «cHARISMa» НИУ ВШЭ.
Имеющийся задел
Программная система мониторинга эффективности HPC TaskMaster, разработанная отделом суперкомпьютерного моделирования НИУ ВШЭ, внедренная в эксплуатацию на суперкомпьютере «cHARISMa».
Заказчик
НИУ ВШЭ / Отдел суперкомпьютерного моделирования НИУ ВШЭ