Логотип МИЭМ НИУ ВШЭ
Готов к работе
Логотип типа проекта Программный
Программный
2025 / 2026
Логотип проекта AIDiagnostic: разработка VL-модели для КТ с поддержкой русского языка
    От компании

2437 AIDiagnostic: разработка VL-модели для КТ с поддержкой русского языка

Заявка создана
01.12.2025
Контроль ПО
03.12.2025
Отправлен на комиссию
03.12.2025
Одобрен
05.12.2025

Паспорт проекта

Аннотация

В рамках проекта планируется разработать русскоязычная визуально-языковая модель (VLM) для анализа компьютерной томографии, объединяющая 3D-визуальный энкодер и языковую модель масштаба ~8 млрд параметров. Система предназначена для интерпретации клинического контекста на русском языке, включая ответы на вопросы по исследованию, извлечение диагностически значимых находок, автоматизированное краткое резюмирование и формирование черновых вариантов заключений. Актуальность проекта обусловлена...

Отрасль

Медицина и здравоохранение

Теги

Медицина
КТ и МРТ
VLM

Цель

Разработать вычислительно эффективную русскоязычную визуально-языковую модель для анализа трёхмерных данных компьютерной томографии, обеспечивающей автоматизированное извлечение клинической информации, формирование ответов на диагностические запросы и генерацию структурированных черновых заключений.

Ожидаемые результаты

  • Предобучение визуального энкодера
    • Реализован скрипт для llm парсинга заключений на наличие мультилейбл классификационных признаков
    • Подготовлен датасет пар КТ- текст заключения с дополнительными классификационными мультилейбл признаками
    • 3D-энкодер ViT/Swin-типа предобучен на задачу контрастивного перевода КТ и текст заключения в единое векторное пространство с дополнительным лоссом
  • Файнтюн VLM с 8B LLM

    Форма и способы промежуточного контроля

    Канал коммуникации: Яндекс-телемост График созвонов и встреч: - Еженедельно проводятся встречи с командой. На них проходит подведение итогов предыдущей недели, распределение задач на новый срок; - Ежемесячно сдается отчетность по проекту

    Форма представления результатов

    Месяц 1-2: сбор/очистка датасета, автоматическая аннотация классификационных меток, реализация архитектуры, метрик, классов проекторов. Месяц 2-4: предобучение визуального энкодера, реализация пайплайна обучения VLM Месяц 4-6: проведение экспериментов обучения VLM с различными гиперпараметрами Месяц 6-8: анализ зависимостей целевых метрик от гиперпараметров и тестирование на клинических задачах, реализация апи сервиса.

    Ресурсное обеспечение

    Участникам команды необходимо иметь: - ОС: Любая Минимальные системные требования: * *- ЦПУ: Процессоры x64 с поддержкой SSE4.2, от четырехъядерных процессоров Intel или AMD с частотой 2,5+ ГГц * *- ОЗУ: от 16 Гб * *- Хранилище: Не менее 2 ТБ свободного места. Проект планирует использовать вычислительные ресурсы суперкомпьютера Charisma НИУ ВШЭ

    Имеющийся задел

    Обезличенные КТ-объёмы (thorax/abdomen/pelvis), связанные с русскоязычными отчётами/метаданными; дополнительно - контролируемый перевод англоязычных отчётов в RU. 2. Описан иерархический классификатор находок на КТ .

    Заказчик

    Организация / AIDiagnostic