Логотип МИЭМ НИУ ВШЭ
Завершен
Логотип типа проекта Программный
Программный
2021 / 2022
Логотип проекта Модификация системы поиска и обработки данных "КРУТ"

1151 Модификация системы поиска и обработки данных "КРУТ"

Старт
15.03.2022
Представление
29.04.2022
Постерная сессия
03.11.2022
Защита
21.04.2023

Паспорт проекта

Аннотация

Корпус русских учебных текстов (КРУТ, http://web-corpora.net/CoRST/search/?interface_language=ru) – база данных текстов, написанных учащимися НИУ ВШЭ и других вузов и отражающих освоение студентами профессиональной академической речи (т.е. содержащих ошибки). База снабжена разметкой нескольких типов: морфологическую, метатекстовой и разметку по ошибкам. Создана система поиска как по морфологическим и лексическим признакам, так и по тегам ошибок. Корпус позволяет проводить исследования...

Отрасль

Информатика

Теги

Информатика

Цель

Усовершенствование и доработка системы Корпуса русских учебных текстов

Ожидаемые результаты

  • 2. Перевод КРУТ на Python3, обновление кода под более современные версии библиотек.

    Форма и способы промежуточного контроля

    Еженедельные встречи по текущим вопросам проекта; периодические сообщения о результатах работы; выступление на представлении проектов и постерной сессии.

    Форма представления результатов

    Еженедельные встречи по текущим вопросам проекта; периодические (не менее 3 за время проекта) сообщения о результатах работы; выступление на представлении проектов и постерной сессии.

    Ресурсное обеспечение

    Реализация проекта может быть осуществлена на базе учебной лаборатории департамента компьютерной инженерии.

    Имеющийся задел

    Создана база данных и система поиска, однако все это требует пересмотра и доработки.

    Заказчик

    НИУ ВШЭ / Школа лингвистики ФГН НИУ ВШЭ