Логотип МИЭМ НИУ ВШЭ
Рабочий
Логотип типа проекта Программный
Программный
2025 / 2026
Логотип проекта Разработка тестового стенда для оценки уязвимости систем, интегрированных с большими языковыми моделями, к атакам класса промпт-инъекций

    2303 Разработка тестового стенда для оценки уязвимости систем, интегрированных с большими языковыми моделями, к атакам класса промпт-инъекций

    Старт
    10.11.2025
    Представление
    26.01.2026 – 06.02.2026
    Постерная сессия
    06.04.2026 – 17.04.2026
    Защита
    08.06.2026 – 19.06.2026

    Паспорт проекта

    Аннотация

    Современные подходы к тестированию больших языковых моделей (LLM) в основном фокусируются на генерации токсичного или вредоносного контента самой моделью и недостаточно учитывают риски, возникающие при их интеграции в веб-приложения. Особенно слабо изучены уязвимости, связанные с механизмом Tool Calling: ошибки в проектировании или реализации могут привести к подмене параметров вызова, несанкционированным действиям и выходу за пределы песочницы. В рамках проекта разрабатывается...

    Отрасль

    Информационная безопасность

    Теги

    LLM
    Web Security
    ML Sec

    Цель

    Разработать единую платформу для выявления уязвимостей веб-приложений, интегрированных с большими языковыми моделями, к атакам типа prompt injection, направленным на компрометацию механизмов Tool Calling, включая несанкционированный вызов инструментов, манипуляцию их параметрами и выход за пределы песочницы выполнения.

    Ожидаемые результаты

    • Обзор научных статей, отчетов (OWASP LLM Top 10, MITRE ATLAS), open-source инструментов по тестированию LLM-систем на уязвимости
      • Анализ основных сценариев интеграции LLM в WEB-приложения c использованием Tool Calling и разработка модели угроз для типовых архитектур таких систем
        • Реализация генератора атак — библиотека шаблонов промпт-инъекций с поддержкой параметризации, мутаций и адаптивных сценариев.

          Форма и способы промежуточного контроля

          Планирование по SCRUM методологии. Онлайн встречи с руководителем каждую неделю. Подготовка промежуточных отчетов

          Форма представления результатов

          Демонстрация готового стенда, реализующего тестирование устойчивости к промпт-инъекциям веб-приложений, имеющих интеграцию с LLM

          Ресурсное обеспечение

          ПК с установленным интерпретатором Python 3.8 и выше GPU для локального развертывания ИИ

          Имеющийся задел

          Обзор научной литературы на темы атак на LLM и LLM-системы, программные реализации части рассматриваемых методов атак

          Заказчик

          МИЭМ / ДЭИ