Завершен
Программный
2021 / 2022
1151 Модификация системы поиска и обработки данных "КРУТ"
Варнавский Александр Николаевич
руководитель проекта
Семичаснов Илья Владимирович
руководитель направления
Старт
15.03.2022
Представление
29.04.2022
Постерная сессия
03.11.2022
Защита
21.04.2023
Паспорт проекта
Аннотация
Корпус русских учебных текстов (КРУТ, http://web-corpora.net/CoRST/search/?interface_language=ru) – база данных текстов, написанных учащимися НИУ ВШЭ и других вузов и отражающих освоение студентами профессиональной академической речи (т.е. содержащих ошибки). База снабжена разметкой нескольких типов: морфологическую, метатекстовой и разметку по ошибкам. Создана система поиска как по морфологическим и лексическим признакам, так и по тегам ошибок. Корпус позволяет проводить исследования...
Отрасль
Информатика
Теги
Информатика
Цель
Усовершенствование и доработка системы Корпуса русских учебных текстов
Ожидаемые результаты
- 2. Перевод КРУТ на Python3, обновление кода под более современные версии библиотек.
Форма и способы промежуточного контроля
Еженедельные встречи по текущим вопросам проекта; периодические сообщения о результатах работы; выступление на представлении проектов и постерной сессии.
Форма представления результатов
Еженедельные встречи по текущим вопросам проекта; периодические (не менее 3 за время проекта) сообщения о результатах работы; выступление на представлении проектов и постерной сессии.
Ресурсное обеспечение
Реализация проекта может быть осуществлена на базе учебной лаборатории департамента компьютерной инженерии.
Имеющийся задел
Создана база данных и система поиска, однако все это требует пересмотра и доработки.
Заказчик
НИУ ВШЭ / Школа лингвистики ФГН НИУ ВШЭ