Логотип МИЭМ НИУ ВШЭ
Завершен
Логотип типа проекта Программный
Программный
2024 / 2025
Логотип проекта Sentigram: программное обеспечение для обработки новостных данных на платформе Telegram

    1655 Sentigram: программное обеспечение для обработки новостных данных на платформе Telegram

    Старт
    24.11.2024
    Представление
    27.01.2025 – 07.02.2025
    Постерная сессия
    14.04.2025 – 25.04.2025
    Защита
    13.05.2025 – 19.05.2025

    Паспорт проекта

    Аннотация

    Понимание динамики распространения новостей в цифровую эпоху является важной задачей в силу следующих причин: 1. Влияние на общественное мнение: новости быстро распространяются в интернете и могут формировать или менять общественное мнение. Понимание этой динамики позволяет выявлять тенденции изменений мнений. 2. Борьба с дезинформацией: понимание, как и почему распространяется информация, может помочь в выявлении и противодействии дезинформации и фейковым новостям. 3. Влияние на реальный...

    Отрасль

    Информатика

    Теги

    Информатика

    Цель

    Создание программного обеспечения для исследователей и аналитиков, позволяющее изучать распространение новостных событий во времени, анализировать новостные события с помощью методов машинного обучения, проводить визуализацию этих данных. позволяющее строить временную шкалу, отражающую распространение новостных событий.

    Ожидаемые результаты

    • DevOps
      • Упаковать Django-сервис в отдельный контейнер с конфигурацией для запуска через Gunicorn и проксированием через Nginx.
      • Упаковать в контейнер и обеспечить взаимодействие с остальными сервисами через Nginx
      • Настроить Nginx как реверс-прокси в отдельном контейнере, балансировать нагрузку между сервисами и обеспечить защиту через HTTPS.
      • Настроить автоматические пайплайны для сборки, тестирования и деплоя приложений..

    Форма и способы промежуточного контроля

    Еженедельные совещания по текущим вопросам проекта и демонстрация текущих результатов работы проекта Еженедельное планирование задач

    Форма представления результатов

    Очная демонстрация Представление результатов проекта заказчику

    Ресурсное обеспечение

    OC: Windows 10, 64-разрядная MacOS

    Имеющийся задел

    1. Реализован сбор информации по слову или фразе с учетом морфологии русского языка; минус-слова операторы для поиска пересечение/объединения искомых подмножеств, точного вхождения фразы; фильтры по источнику, по географии и языку источника, по типу и тематике источника, по количеству подписчиков 2. Реализована визуализация графа распространения новостей и графа репостов с помощью библиотеки Telethon языка Python. 3. Реализовано определение эмоционального окраса текста с помощью дообученной...

    Заказчик

    НИУ ВШЭ / Заполнено автоматически