Рабочий
2025 / 2026

2264 Система тестирования моделей для борьбы с deepfake
Старт
10.10.2025
Представление
05.11.2025 – 19.11.2025
Постерная сессия
26.01.2026 – 06.02.2026
Защита
06.04.2026 – 17.04.2026
Паспорт проекта
Аннотация
Надежные системы моделей для детекции deepfake критически важны для нейтрализации быстро эволюционирующих методов генерации дипфейков.
Для оценки данных моделей необходимо иметь надежную систему оценки, позволяющую в автоматическом режиме оценить устойчивость модели к старым и новым методам атаки. Создание стандартизированных тестовых сред и бенчмарков ускоряет разработку и внедрение эффективных инструментов борьбы с дипфейками для платформ, СМИ и правоохранительных органов.
Отрасль
Информационная безопасность
Теги
Безопасность
Машинное обучение
ИИ
Deepfake
Цель
Разработать автоматизированную платформу для оценки устойчивости моделей детекции Deepfake на видео данных.
1. Провести исследование современных методов генерации Deepfake
2. Собрать скрипты для генерации тестовой базы по заданным параметрам
3. Собрать релевантные тестовые наборы для проведения оценки
4. Собрать систему для автоматического расчета метрик устойчивости модели
Ожидаемые результаты
- Формирование набора скриптов для генерации современных deepfake
- Создание системы для автоматизации процесса оценки моделей
- Собрать демонстрационный стенд для демонстрации работоспособности системы
Форма и способы промежуточного контроля
1) Регулярные встречи для обсуждения ключевых задач
2) Презентация промежуточных результатов
Форма представления результатов
1) Репозиторий с исходным кодом, документацией и собранными верифицированными размеченными датасетами
2) Презентация и защита проекта
3) Публикация результатов в научной статье или доклад на конференции
Ресурсное обеспечение
1) Суперкомпьютер МИЭМ для обучения моделей
2) Бесплатные ресурсы Google Colab
Имеющийся задел
Ранее в ноябре 2024 г была опубликована база (BioDeepAV) с более 1600 подробных поддельных видеороликов: диффузионные модели, NeRF и Gaussian Splatting. Эта база использовала три источника изображений лиц: 300 искусственных лиц, сгенерированных RealVisXLv5, LAION-Face и изображения лиц из набора данных HDTF.
Реальные данные для генерации были взяты из наборов данных HDTF и TalkingHead-1KH. https://m.selectdataset.com
Предлагается расширить данный датасет и автоматизировать процесс наполнения...
Заказчик
МИЭМ / ДЭИ