Рабочий
2025 / 2026

2268 Обнаружение аномалий в больших данных финансового сектора с использованием методов машинного обучения
Старт
17.09.2025
Представление
05.11.2025 – 19.11.2025
Постерная сессия
26.01.2026 – 06.02.2026
Защита
06.04.2026 – 17.04.2026
Паспорт проекта
Аннотация
Финансовый сектор генерирует огромные объемы данных, включая транзакции, логи доступа, рыночные индикаторы и поведенческие паттерны клиентов. Обнаружение аномалий в этих данных позволяет выявлять мошенничество, кибератаки, ошибки в транзакциях и другие подозрительные активности. В данном исследовании рассматриваются методы машинного обучения для автоматического выявления аномалий в больших финансовых данных, сравнивается их эффективность и предлагаются подходы к улучшению точности...
Отрасль
Информатика
Теги
FinTech
BigData
MachineLearning
FinancialAnalytics
Цель
Разработка и сравнительный анализ методов машинного обучения для автоматического обнаружения аномалий в финансовых данных, включая мошеннические транзакции, киберугрозы и отклонения в рыночных показателях.
Ожидаемые результаты
- Анализ современных методов обнаружения аномалий в финансовых данных
- Обзор существующих подходов (статистические методы, ML, DL, гибридные методы)
- Выявление ключевых проблем и ограничений в текущих решениях
- Анализ применимости методов для разных типов финансовых данных (транзакции, логи, временные ряды).
- Подготовка и предобработка данных
- Сбор и разметка датасетов (например, Kaggle, банковские транзакции, рыночные данные)
- Очистка данных, обработка пропусков, нормализация
Форма и способы промежуточного контроля
1. Отчетность и документация
Еженедельные отчеты
Краткое описание выполненных задач..
Фиксация экспериментов, гипотез, результатов.
Документирование кода и данных (README, комментарии).
2. Промежуточные презентации
Демонстрация текущих результатов (графики, метрики).
3. Презентация этапов: обзор литературы, предобработка данных, тестирование моделей.
3. Проверка кода и экспериментов
Code Review (GitHub/GitLab):
Проверка корректности реализации алгоритмов.
Воспроизводимость...
Форма представления результатов
Научно-технический отчет, оформленный в соответствии с ГОСТ 7.32-2017, объемом не менее 50 страниц, содержащий приложения, иллюстрационный материал, результаты анализ и экспериментов.
Презентация проекта (слайды), предназначенная для итоговой защиты.
Научные статьи или тезисы докладов, подготовленные для публикации в профильном сборнике или для участия в конференции
Ресурсное обеспечение
Вычислительные ресурсы:
Локальные рабочие станции:
GPU: NVIDIA RTX A5000 (16GB)
CPU: Intel Xeon 8-ядерный
RAM: 64GB DDR4
Облачная инфраструктура:
Google Colab (для запуска моделей на GPU)
Программный стек:
ML-фреймворки: TensorFlow Extended (TFX), PyTorch Lightning
Открытые наборы данных:
1. Транзакционные данные (платежи, мошенничество)
IEEE-CIS Fraud Detection
Источник: Kaggle
PaySim Mobile Money
Описание: Синтетические данные, имитирующие мобильные платежи
Источник: Kaggle
AMLSim...
Имеющийся задел
Глава книги Aleksandr Lazarenko, Sergey Avdoshin Financial Risks of the Blockchain Industry: A Survey of Cyberattacks , in : Proceedings of the Future Technologies Conference (FTC) 2018 Volume 2. / Ed. by A. Kohei, B. Rahul, K. Supriya. Vol. 2 Cham: Springer, 2019. doi P. 368–384.
Заказчик
МИЭМ / ДКИ