Логотип МИЭМ НИУ ВШЭ
Рабочий
Логотип типа проекта Программный
Программный
2025 / 2026
Логотип проекта HAIPy: ИИ ассистент для проверки домашних заданий по Python

    2262 HAIPy: ИИ ассистент для проверки домашних заданий по Python

    Старт
    11.10.2025
    Представление
    05.11.2025 – 19.11.2025
    Постерная сессия
    26.01.2026 – 06.02.2026
    Защита
    06.04.2026 – 17.04.2026

    Паспорт проекта

    Аннотация

    Проект направлен на создание системы автоматической проверки домашних заданий, которая сможет выставлять оценки и предоставлять обратную связь студентам. Такая система позволит значительно снизить нагрузку на учебных ассистентов и преподавателей. По сравнению с классическим подходом она обеспечивает более высокую скорость проверки и меньшие затраты, при этом благодаря персонализированной обратной связи сохраняется индивидуальный подход к каждому студенту.

    Отрасль

    Информатика

    Теги

    Python
    Машинное обучение
    Глубинное обучение
    Deep Learning
    NLP

    Цель

    Создать сервис способный проверять файлы дз формата .ipynb, выставлять оценку и давать обратную связь

    Ожидаемые результаты

    • Работа с данными и формирование датасета
      • Сформировать датасет из открытых источников. Датасет - это совокупность файлов с дз, датафрейма лейблами для каждого файла
      • Поднять разметчик
      • Сделать разметку данных
      • Осуществить поиск полезных фичей/ фиче инженеринг
    • Разработка сервиса
      • Создать репозиторий с кодом
      • Загрузить модель на сервер
      • Реализовать сервис с ручками для работы модели на основе FastAPI
    • Тестирование
      • Провести валидацию разметки
      • Написать модульные тесты для сервисных компонентов

    Форма и способы промежуточного контроля

    - декомпозиция задач по тикетам - проведение еженедельных онлайн-встреч для обсуждения хода работы

    Форма представления результатов

    - сервис в формате MaaS(Model as a Service)

    Ресурсное обеспечение

    - личные компьютеры - доступ к суперкомпьютеру Charisma для обучения нейронных сетей

    Имеющийся задел

    Было протестировано качество решения задачи с использованием моделей ChatGPT и DeepSeek. Выявлено, что они часто допускают ошибки: путают контексты, переносят неточности из одной работы в другую, искажают оценки и рекомендации. Также иногда модели пропускают отдельные задания при проверке. В настоящий момент имеется порядка сотни файлов с домашними заданиями и комментариями к ним; в дальнейшем планируется расширить выборку за счёт открытых источников и применить методы аугментации данных.

    Заказчик

    МИЭМ / ДПМ