Логотип МИЭМ НИУ ВШЭ
Рабочий
Логотип типа проекта Научно-исследовательская работа
Научно-исследовательская работа
2025 / 2026
Логотип проекта Обнаружение аномалий в больших данных финансового сектора с использованием методов машинного обучения

    2268 Обнаружение аномалий в больших данных финансового сектора с использованием методов машинного обучения

    Старт
    17.09.2025
    Представление
    05.11.2025 – 19.11.2025
    Постерная сессия
    26.01.2026 – 06.02.2026
    Защита
    06.04.2026 – 17.04.2026

    Паспорт проекта

    Аннотация

    Финансовый сектор генерирует огромные объемы данных, включая транзакции, логи доступа, рыночные индикаторы и поведенческие паттерны клиентов. Обнаружение аномалий в этих данных позволяет выявлять мошенничество, кибератаки, ошибки в транзакциях и другие подозрительные активности. В данном исследовании рассматриваются методы машинного обучения для автоматического выявления аномалий в больших финансовых данных, сравнивается их эффективность и предлагаются подходы к улучшению точности...

    Отрасль

    Информатика

    Теги

    FinTech
    BigData
    MachineLearning
    FinancialAnalytics

    Цель

    Разработка и сравнительный анализ методов машинного обучения для автоматического обнаружения аномалий в финансовых данных, включая мошеннические транзакции, киберугрозы и отклонения в рыночных показателях.

    Ожидаемые результаты

    • Анализ современных методов обнаружения аномалий в финансовых данных
      • Обзор существующих подходов (статистические методы, ML, DL, гибридные методы)
      • Выявление ключевых проблем и ограничений в текущих решениях
      • Анализ применимости методов для разных типов финансовых данных (транзакции, логи, временные ряды).
    • Подготовка и предобработка данных
      • Сбор и разметка датасетов (например, Kaggle, банковские транзакции, рыночные данные)
      • Очистка данных, обработка пропусков, нормализация

    Форма и способы промежуточного контроля

    1. Отчетность и документация Еженедельные отчеты Краткое описание выполненных задач.. Фиксация экспериментов, гипотез, результатов. Документирование кода и данных (README, комментарии). 2. Промежуточные презентации Демонстрация текущих результатов (графики, метрики). 3. Презентация этапов: обзор литературы, предобработка данных, тестирование моделей. 3. Проверка кода и экспериментов Code Review (GitHub/GitLab): Проверка корректности реализации алгоритмов. Воспроизводимость...

    Форма представления результатов

    Научно-технический отчет, оформленный в соответствии с ГОСТ 7.32-2017, объемом не менее 50 страниц, содержащий приложения, иллюстрационный материал, результаты анализ и экспериментов. Презентация проекта (слайды), предназначенная для итоговой защиты. Научные статьи или тезисы докладов, подготовленные для публикации в профильном сборнике или для участия в конференции

    Ресурсное обеспечение

    Вычислительные ресурсы: Локальные рабочие станции: GPU: NVIDIA RTX A5000 (16GB) CPU: Intel Xeon 8-ядерный RAM: 64GB DDR4 Облачная инфраструктура: Google Colab (для запуска моделей на GPU) Программный стек: ML-фреймворки: TensorFlow Extended (TFX), PyTorch Lightning Открытые наборы данных: 1. Транзакционные данные (платежи, мошенничество) IEEE-CIS Fraud Detection Источник: Kaggle PaySim Mobile Money Описание: Синтетические данные, имитирующие мобильные платежи Источник: Kaggle AMLSim...

    Имеющийся задел

    Глава книги Aleksandr Lazarenko, Sergey Avdoshin Financial Risks of the Blockchain Industry: A Survey of Cyberattacks , in : Proceedings of the Future Technologies Conference (FTC) 2018 Volume 2. / Ed. by A. Kohei, B. Rahul, K. Supriya. Vol. 2 Cham: Springer, 2019. doi P. 368–384.

    Заказчик

    МИЭМ / ДКИ