Логотип МИЭМ НИУ ВШЭ
Завершен
Логотип типа проекта Научно-исследовательская работа
Научно-исследовательская работа
2021 / 2022
Логотип проекта Современные методы анализа лингвистических данных: сетевые методы и корпусная лингвистика

1055 Современные методы анализа лингвистических данных: сетевые методы и корпусная лингвистика

Старт
15.03.2022
Представление
10.06.2022
Постерная сессия
03.11.2022
Защита
02.02.2023

Паспорт проекта

Аннотация

По мере развития вычислительных возможностей, в разных областях науки появляются все более и более масштабные датасеты. В частности, в лингвистике получили большое применение корпусы языка. Для анализа встречаемости словоформ в корпусах развито большое количество статистических методов. Большое значение при их применении имеет вопрос контроля смещения выборки. Также большое применение получили методы анализа данных, основанные на идеях теории сложных сетей. В рамках настоящего проекта студенту...

Отрасль

Информатика

Теги

Информатика

Цель

Освоение современных методов анализа данных в лингвистике, в частности методов, основанных на применении теории сложных сетей и статистических методов корпусной лингвистики.

Ожидаемые результаты

  • 1. Программные продукты для статистического анализа эволюции встречаемости словоформ в корпусе.
    • 2. Сравнение локальных и макроскопических структурных характеристик сетей ассоциаций русского и английского языка.
      • 3. Анализ данных психолингвистических экспериментов о сложности тестов Медника.

        Форма и способы промежуточного контроля

        По регламенту проектной деятельности МИЭМ НИУ ВШЭ

        Форма представления результатов

        По регламенту проектной деятельности МИЭМ НИУ ВШЭ

        Ресурсное обеспечение

        Google Colab

        Имеющийся задел

        В нашей группе ранее проводились исследования структуры сетей ассоциаций русского и английского языка, а также связи сети ассоциаций английского языка и сложности психолингвистических тестов креативности (тестов Медника). В настоящее время институтом психологии РАН готовится эксперимент по измерению сложности тестов Медника на русском языке.

        Заказчик

        МИЭМ / ДПМ