Завершен
2024 / 2025

2056 Датасет для задачи оценки корректности студенческих отчетов технического профиля
Старт
14.10.2024
Представление
05.11.2024 – 15.11.2024
Постерная сессия
27.01.2025 – 07.02.2025
Защита
14.04.2025 – 25.04.2025
Паспорт проекта
Аннотация
Программное обеспечение, использующее методы машинного обучения, может значительно ускорить и упростить процесс проверки текстов на наличие ошибок. Это особенно важно для таких областей, как образование, где проверка студенческих работ требует значительных временных затрат, а также для издательской деятельности, где каждая ошибка может привести к серьезным репутационным потерям.
Для корректного обучения систем, использующих методы машинного обучения, необходимо разработать специализированный...
Отрасль
Философия
Теги
датасет
dataset
machine learning
ML
NLP
Цель
Разработать специализированный датасет, который будет содержать размеченные предложения из текстов отчетных материалов студентов технического профиля. Разработать тестовую модель МО для оценки даатсета.
Ожидаемые результаты
- Специализированный датасет.
- Тестовая модель МО.
Форма и способы промежуточного контроля
1. Еженедельные отчеты.
Форма представления результатов
Выступление на кнференции Арменского.
Ресурсное обеспечение
Материалы и оборудование УЛ САПР МИЭМ НИУ ВШЭ (712/714 каб.).
Набор уже созданных текстовых датасетов УЛ САПР.
Имеющийся задел
Имеется набор текстов на русском языке с ошибочными фразами (ВКР, проекты).
Пример разработанного ранее даатсета: https://zenodo.org/records/7738755
Заказчик
МИЭМ / ДКИ