Рабочий
2025 / 2026

2303 Разработка тестового стенда для оценки уязвимости систем, интегрированных с большими языковыми моделями, к атакам класса промпт-инъекций
Старт
10.11.2025
Представление
26.01.2026 – 06.02.2026
Постерная сессия
06.04.2026 – 17.04.2026
Защита
08.06.2026 – 19.06.2026
Паспорт проекта
Аннотация
Современные подходы к тестированию больших языковых моделей (LLM) в основном фокусируются на генерации токсичного или вредоносного контента самой моделью и недостаточно учитывают риски, возникающие при их интеграции в веб-приложения. Особенно слабо изучены уязвимости, связанные с механизмом Tool Calling: ошибки в проектировании или реализации могут привести к подмене параметров вызова, несанкционированным действиям и выходу за пределы песочницы.
В рамках проекта разрабатывается...
Отрасль
Информационная безопасность
Теги
LLM
Web Security
ML Sec
Цель
Разработать единую платформу для выявления уязвимостей веб-приложений, интегрированных с большими языковыми моделями, к атакам типа prompt injection, направленным на компрометацию механизмов Tool Calling, включая несанкционированный вызов инструментов, манипуляцию их параметрами и выход за пределы песочницы выполнения.
Ожидаемые результаты
- Обзор научных статей, отчетов (OWASP LLM Top 10, MITRE ATLAS), open-source инструментов по тестированию LLM-систем на уязвимости
- Анализ основных сценариев интеграции LLM в WEB-приложения c использованием Tool Calling и разработка модели угроз для типовых архитектур таких систем
- Реализация генератора атак — библиотека шаблонов промпт-инъекций с поддержкой параметризации, мутаций и адаптивных сценариев.
Форма и способы промежуточного контроля
Планирование по SCRUM методологии. Онлайн встречи с руководителем каждую неделю. Подготовка промежуточных отчетов
Форма представления результатов
Демонстрация готового стенда, реализующего тестирование устойчивости к промпт-инъекциям веб-приложений, имеющих интеграцию с LLM
Ресурсное обеспечение
ПК с установленным интерпретатором Python 3.8 и выше
GPU для локального развертывания ИИ
Имеющийся задел
Обзор научной литературы на темы атак на LLM и LLM-системы, программные реализации части рассматриваемых методов атак
Заказчик
МИЭМ / ДЭИ