Рабочий
2025 / 2026

2265 Методы обнаружения текстовых Deepfake-атак с использованием ИИ
Старт
22.09.2025
Представление
05.11.2025 – 19.11.2025
Постерная сессия
26.01.2026 – 06.02.2026
Защита
06.04.2026 – 17.04.2026
Паспорт проекта
Аннотация
С развитием генеративных языковых моделей (GPT-4, Claude, Gemini, DeepSeek) резко возросло злонамеренное использование синтетических текстов: распространение фейковых новостей, фишинговых атак и социальной инженерии. Это создаёт риски дезинформации, спама, мошенничества и манипуляций. Существующие методы детекции часто отстают от эволюции ИИ, что требует разработки более надёжных решений.
Отрасль
Информационная безопасность
Теги
DeepfakeDetection
TextDeepfake
MachineLearning
Цель
Разработать и протестировать эффективные методы и прототип системы для автоматического обнаружения текстовых deepfake-атак, обеспечивающей высокую точность отличия человеческого текста от текста сгенерированного ИИ.
Ожидаемые результаты
- Аналитический обзор существующих методов обнаружения текстовых deepfake-атак
- Набор размеченных данных текстовых человеческих и deepfake-примеров
- Реализация и обучение несколько моделей
- Репозиторий с исходным кодом моделей и инструкцией по применению
- Эксперименты с моделями
- Тестирование эффективности моделей
- Оценка метрик: *Accuracy, F1-Score, AUC-ROC
- Анализ устойчивости:
- Проверка, как детекторы справляются с адаптивными атаками
- Исследование обобщающей способности на новых типах Deepfake
Форма и способы промежуточного контроля
1. Этапные отчеты
Форма: Письменный отчет (презентация)
Способ проверки: Встречи с научным руководителем / обсуждение в группе
2. Проверка рабочих версий кода и данных
Форма: Репозиторий на GitHub/GitLab
Jupyter-ноутбуки с тестами моделей
Периодичность: Постепенное обновление (еженедельно)
3. Экспериментальные результаты и метрики
Форма: Таблицы/графики (Google Docs, Excel)
Сравнение точности моделей (Accuracy, F1-score)
Периодичность: После каждого значимого эксперимента
4. Промежуточные...
Форма представления результатов
Научно-технический отчет
Форма: PDF-документ (40-60 стр.)
Научная статья
Форма: Статья в журнале/конференции (8-12 стр.)
Ресурсное обеспечение
Вычислительные мощности:
Облачные сервисы:
Google Colab Pro
Яндекс.Облако (GPU Tesla V100)
Локальные решения:
Рабочая станция с GPU (NVIDIA RTX 3090/4090)
Минимальные требования: 16 ГБ RAM, SSD 1 ТБ
Программное обеспечение:
Python 3.9+ (библиотеки: transformers, scikit-learn)
Jupyter Notebook
Git/GitHub
2. Данные
Источники датасетов:
Открытые:
HuggingFace Datasets (GPT-wiki, FakeNewsNet)
Kaggle (ChatGPT Generated Text)
Собственные:
Парсинг новостных сайтов (с соблюдением robots.txt)
Разметка...
Имеющийся задел
Sergey Avdoshin, Elena Pesotskaya, Denis Volkov, Yabin Alejandro Lagunes Cuevas Enhanced Cybersecurity: AI-Driven Phishing Fraud Detection Approach , in : Advances in Information and Communication. Proceedings of the 2025 Future of Information and Communication Conference (FICC), Volume 2. Vol. 2 Switzerland: Springer, 2025. doi P. 352–368.
Заказчик
МИЭМ / ДКИ