Завершен
Программный
2023 / 2024
1692 Цифровой след: инфраструктура
Старт
06.10.2023
Представление
09.11.2023
Постерная сессия
27.01.2024 – 07.02.2024
Защита
29.05.2024
Паспорт проекта
Аннотация
Проект является продолжением проектов 394 «Цифровой след: сбор данных» и 300 "Интеграционная шина сервисов МИЭМ" с упором на задачи, связанные с разработкой инфраструктуры серверной части системы цифрового следа. В рамках реализации запланирован переход на полностью новую архитектуру системы и стек технологий, включающий в себя Apache Kafka, Clickhouse, Apache Airflow, перенос системы на новый сервер для обеспечения бесперебойной работы всех сервисов.
Отрасль
Информатика
Теги
Информатика
Цель
Внедрение и бесперебойная поддержка сервисов для сбора, обработки и хранения данных использования студентами и преподавателями цифровых сервисов НИУ ВШЭ.
Ожидаемые результаты
- - новая архитектура системы сбора и хранения данных цифрового следа
- - миграция текущих данных базы цифрового следа на новый сервер в новую инфраструктуру
- - новая схема базы данных системы цифрового следа на основе Clickhouse
Форма и способы промежуточного контроля
• Еженедельное собрание с обсуждением задач
• Code Review
Форма представления результатов
• Внедрение инструментов в сервисы Цифрового МИЭМа
• Публичная защита проекта перед комиссией
Ресурсное обеспечение
Сервер с ОС Linux (не менее 32 GB RAM, 20 CPU, 150 GB ROM)
Имеющийся задел
Проект наследует адаптеры (сборщики данных) от текущей системы цифрового следа, будет использовать очередь сообщений на основе Apache Kafka, разработанную в рамках проекта по интеграционной шине, при этом общая архитектура системы с точки зрения способов хранения данных и взаимодействия с проектами по аналитике и визуализации цифрового следа перестраивается полностью.
Заказчик
МИЭМ / ДПМ