Логотип МИЭМ НИУ ВШЭ
Завершен
Логотип типа проекта Программный
Программный
2024 / 2025
Логотип проекта Датасет для задачи оценки корректности студенческих отчетов технического профиля

    2056 Датасет для задачи оценки корректности студенческих отчетов технического профиля

    Старт
    14.10.2024
    Представление
    05.11.2024 – 15.11.2024
    Постерная сессия
    27.01.2025 – 07.02.2025
    Защита
    14.04.2025 – 25.04.2025

    Паспорт проекта

    Аннотация

    Программное обеспечение, использующее методы машинного обучения, может значительно ускорить и упростить процесс проверки текстов на наличие ошибок. Это особенно важно для таких областей, как образование, где проверка студенческих работ требует значительных временных затрат, а также для издательской деятельности, где каждая ошибка может привести к серьезным репутационным потерям. Для корректного обучения систем, использующих методы машинного обучения, необходимо разработать специализированный...

    Отрасль

    Философия

    Теги

    датасет
    dataset
    machine learning
    ML
    NLP

    Цель

    Разработать специализированный датасет, который будет содержать размеченные предложения из текстов отчетных материалов студентов технического профиля. Разработать тестовую модель МО для оценки даатсета.

    Ожидаемые результаты

    • Специализированный датасет.
      • Тестовая модель МО.

        Форма и способы промежуточного контроля

        1. Еженедельные отчеты.

        Форма представления результатов

        Выступление на кнференции Арменского.

        Ресурсное обеспечение

        Материалы и оборудование УЛ САПР МИЭМ НИУ ВШЭ (712/714 каб.). Набор уже созданных текстовых датасетов УЛ САПР.

        Имеющийся задел

        Имеется набор текстов на русском языке с ошибочными фразами (ВКР, проекты). Пример разработанного ранее даатсета: https://zenodo.org/records/7738755

        Заказчик

        МИЭМ / ДКИ