Логотип МИЭМ НИУ ВШЭ
Рабочий
Логотип типа проекта Научно-исследовательская работа
Научно-исследовательская работа
2025 / 2026
Логотип проекта Методы обнаружения текстовых Deepfake-атак с использованием ИИ

    2265 Методы обнаружения текстовых Deepfake-атак с использованием ИИ

    Старт
    22.09.2025
    Представление
    05.11.2025 – 19.11.2025
    Постерная сессия
    26.01.2026 – 06.02.2026
    Защита
    06.04.2026 – 17.04.2026

    Паспорт проекта

    Аннотация

    С развитием генеративных языковых моделей (GPT-4, Claude, Gemini, DeepSeek) резко возросло злонамеренное использование синтетических текстов: распространение фейковых новостей, фишинговых атак и социальной инженерии. Это создаёт риски дезинформации, спама, мошенничества и манипуляций. Существующие методы детекции часто отстают от эволюции ИИ, что требует разработки более надёжных решений.

    Отрасль

    Информационная безопасность

    Теги

    DeepfakeDetection
    TextDeepfake
    MachineLearning

    Цель

    Разработать и протестировать эффективные методы и прототип системы для автоматического обнаружения текстовых deepfake-атак, обеспечивающей высокую точность отличия человеческого текста от текста сгенерированного ИИ.

    Ожидаемые результаты

    • Аналитический обзор существующих методов обнаружения текстовых deepfake-атак
      • Набор размеченных данных текстовых человеческих и deepfake-примеров
        • Реализация и обучение несколько моделей
        • Репозиторий с исходным кодом моделей и инструкцией по применению
      • Эксперименты с моделями
        • Тестирование эффективности моделей
        • Оценка метрик: *Accuracy, F1-Score, AUC-ROC
      • Анализ устойчивости:
        • Проверка, как детекторы справляются с адаптивными атаками
      • Исследование обобщающей способности на новых типах Deepfake

        Форма и способы промежуточного контроля

        1. Этапные отчеты Форма: Письменный отчет (презентация) Способ проверки: Встречи с научным руководителем / обсуждение в группе 2. Проверка рабочих версий кода и данных Форма: Репозиторий на GitHub/GitLab Jupyter-ноутбуки с тестами моделей Периодичность: Постепенное обновление (еженедельно) 3. Экспериментальные результаты и метрики Форма: Таблицы/графики (Google Docs, Excel) Сравнение точности моделей (Accuracy, F1-score) Периодичность: После каждого значимого эксперимента 4. Промежуточные...

        Форма представления результатов

        Научно-технический отчет Форма: PDF-документ (40-60 стр.) Научная статья Форма: Статья в журнале/конференции (8-12 стр.)

        Ресурсное обеспечение

        Вычислительные мощности: Облачные сервисы: Google Colab Pro Яндекс.Облако (GPU Tesla V100) Локальные решения: Рабочая станция с GPU (NVIDIA RTX 3090/4090) Минимальные требования: 16 ГБ RAM, SSD 1 ТБ Программное обеспечение: Python 3.9+ (библиотеки: transformers, scikit-learn) Jupyter Notebook Git/GitHub 2. Данные Источники датасетов: Открытые: HuggingFace Datasets (GPT-wiki, FakeNewsNet) Kaggle (ChatGPT Generated Text) Собственные: Парсинг новостных сайтов (с соблюдением robots.txt) Разметка...

        Имеющийся задел

        Sergey Avdoshin, Elena Pesotskaya, Denis Volkov, Yabin Alejandro Lagunes Cuevas Enhanced Cybersecurity: AI-Driven Phishing Fraud Detection Approach , in : Advances in Information and Communication. Proceedings of the 2025 Future of Information and Communication Conference (FICC), Volume 2. Vol. 2 Switzerland: Springer, 2025. doi P. 352–368.

        Заказчик

        МИЭМ / ДКИ