Завершен
2024 / 2025

1655 Sentigram: программное обеспечение для обработки новостных данных на платформе Telegram
Мазур Дарья Александровна
руководитель проекта
Сластников Сергей Александрович
руководитель направления
Старт
24.11.2024
Представление
27.01.2025 – 07.02.2025
Постерная сессия
14.04.2025 – 25.04.2025
Защита
13.05.2025 – 19.05.2025
Паспорт проекта
Аннотация
Понимание динамики распространения новостей в цифровую эпоху является важной задачей в силу следующих причин: 1. Влияние на общественное мнение: новости быстро распространяются в интернете и могут формировать или менять общественное мнение. Понимание этой динамики позволяет выявлять тенденции изменений мнений. 2. Борьба с дезинформацией: понимание, как и почему распространяется информация, может помочь в выявлении и противодействии дезинформации и фейковым новостям. 3. Влияние на реальный...
Отрасль
Информатика
Теги
Информатика
Цель
Создание программного обеспечения для исследователей и аналитиков, позволяющее изучать распространение новостных событий во времени, анализировать новостные события с помощью методов машинного обучения, проводить визуализацию этих данных.
позволяющее строить временную шкалу, отражающую распространение новостных событий.
Ожидаемые результаты
- DevOps
- Упаковать Django-сервис в отдельный контейнер с конфигурацией для запуска через Gunicorn и проксированием через Nginx.
- Упаковать в контейнер и обеспечить взаимодействие с остальными сервисами через Nginx
- Настроить Nginx как реверс-прокси в отдельном контейнере, балансировать нагрузку между сервисами и обеспечить защиту через HTTPS.
- Настроить автоматические пайплайны для сборки, тестирования и деплоя приложений..
Форма и способы промежуточного контроля
Еженедельные совещания по текущим вопросам проекта и демонстрация текущих
результатов работы проекта
Еженедельное планирование задач
Форма представления результатов
Очная демонстрация
Представление результатов проекта заказчику
Ресурсное обеспечение
OC: Windows 10, 64-разрядная
MacOS
Имеющийся задел
1. Реализован сбор информации по слову или фразе с учетом морфологии русского языка; минус-слова операторы для поиска пересечение/объединения искомых подмножеств, точного вхождения фразы; фильтры по источнику, по географии и языку источника, по типу и тематике источника, по количеству подписчиков
2. Реализована визуализация графа распространения новостей и графа репостов с помощью библиотеки Telethon языка Python.
3. Реализовано определение эмоционального окраса текста с помощью дообученной...
Заказчик
НИУ ВШЭ / Заполнено автоматически