2265 Методы обнаружения текстовых Deepfake-атак с использованием ИИ

Авдошин Сергей Михайлович

руководитель проекта

Старт

22.09.2025

Представление

05.11.2025 – 19.11.2025

Постерная сессия

26.01.2026 – 06.02.2026

Защита

06.04.2026 – 17.04.2026

Паспорт проекта

Аннотация

С развитием генеративных языковых моделей (GPT-4, Claude, Gemini, DeepSeek) резко возросло злонамеренное использование синтетических текстов: распространение фейковых новостей, фишинговых атак и социальной инженерии. Это создаёт риски дезинформации, спама, мошенничества и манипуляций. Существующие методы детекции часто отстают от эволюции ИИ, что требует разработки более надёжных решений.

Отрасль

Информационная безопасность

Цель

Разработать и протестировать эффективные методы и прототип системы для автоматического обнаружения текстовых deepfake-атак, обеспечивающей высокую точность отличия человеческого текста от текста сгенерированного ИИ.

Ожидаемые результаты

Аналитический обзор существующих методов обнаружения текстовых deepfake-атак
Набор размеченных данных текстовых человеческих и deepfake-примеров
- Реализация и обучение несколько моделей
- Репозиторий с исходным кодом моделей и инструкцией по применению
Эксперименты с моделями
- Тестирование эффективности моделей
- Оценка метрик: *Accuracy, F1-Score, AUC-ROC
Анализ устойчивости:
- Проверка, как детекторы справляются с адаптивными атаками
Исследование обобщающей способности на новых типах Deepfake

Форма и способы промежуточного контроля

1. Этапные отчеты Форма: Письменный отчет (презентация) Способ проверки: Встречи с научным руководителем / обсуждение в группе 2. Проверка рабочих версий кода и данных Форма: Репозиторий на GitHub/GitLab Jupyter-ноутбуки с тестами моделей Периодичность: Постепенное обновление (еженедельно) 3. Экспериментальные результаты и метрики Форма: Таблицы/графики (Google Docs, Excel) Сравнение точности моделей (Accuracy, F1-score) Периодичность: После каждого значимого эксперимента 4. Промежуточные...

Форма представления результатов

Научно-технический отчет Форма: PDF-документ (40-60 стр.) Научная статья Форма: Статья в журнале/конференции (8-12 стр.)

Ресурсное обеспечение

Вычислительные мощности: Облачные сервисы: Google Colab Pro Яндекс.Облако (GPU Tesla V100) Локальные решения: Рабочая станция с GPU (NVIDIA RTX 3090/4090) Минимальные требования: 16 ГБ RAM, SSD 1 ТБ Программное обеспечение: Python 3.9+ (библиотеки: transformers, scikit-learn) Jupyter Notebook Git/GitHub 2. Данные Источники датасетов: Открытые: HuggingFace Datasets (GPT-wiki, FakeNewsNet) Kaggle (ChatGPT Generated Text) Собственные: Парсинг новостных сайтов (с соблюдением robots.txt) Разметка...

Имеющийся задел

Sergey Avdoshin, Elena Pesotskaya, Denis Volkov, Yabin Alejandro Lagunes Cuevas Enhanced Cybersecurity: AI-Driven Phishing Fraud Detection Approach , in : Advances in Information and Communication. Proceedings of the 2025 Future of Information and Communication Conference (FICC), Volume 2. Vol. 2 Switzerland: Springer, 2025. doi P. 352–368.