Логотип МИЭМ НИУ ВШЭ
Завершен
Логотип типа проекта Программный
Программный
2021 / 2022
Логотип проекта Модификация системы поиска и обработки данных "КРУТ"

    1151 Модификация системы поиска и обработки данных "КРУТ"

    Старт
    15.03.2022
    Представление
    29.04.2022
    Постерная сессия
    03.11.2022
    Защита
    21.04.2023

    Паспорт проекта

    Аннотация

    Корпус русских учебных текстов (КРУТ, http://web-corpora.net/CoRST/search/?interface_language=ru) – база данных текстов, написанных учащимися НИУ ВШЭ и других вузов и отражающих освоение студентами профессиональной академической речи (т.е. содержащих ошибки). База снабжена разметкой нескольких типов: морфологическую, метатекстовой и разметку по ошибкам. Создана система поиска как по морфологическим и лексическим признакам, так и по тегам ошибок. Корпус позволяет проводить исследования...

    Отрасль

    Информатика

    Теги

    Информатика

    Цель

    Усовершенствование и доработка системы Корпуса русских учебных текстов

    Ожидаемые результаты

    • 2. Перевод КРУТ на Python3, обновление кода под более современные версии библиотек.

      Форма и способы промежуточного контроля

      Еженедельные встречи по текущим вопросам проекта; периодические сообщения о результатах работы; выступление на представлении проектов и постерной сессии.

      Форма представления результатов

      Еженедельные встречи по текущим вопросам проекта; периодические (не менее 3 за время проекта) сообщения о результатах работы; выступление на представлении проектов и постерной сессии.

      Ресурсное обеспечение

      Реализация проекта может быть осуществлена на базе учебной лаборатории департамента компьютерной инженерии.

      Имеющийся задел

      Создана база данных и система поиска, однако все это требует пересмотра и доработки.

      Заказчик

      НИУ ВШЭ / Школа лингвистики ФГН НИУ ВШЭ