Логотип МИЭМ НИУ ВШЭ
Завершен
Логотип типа проекта Научно-исследовательская работа
Научно-исследовательская работа
2023 / 2024
Логотип проекта Примененние нейросетей для построения малоразмерного представления данных на основе алгоритма tSNE.

    1900 Примененние нейросетей для построения малоразмерного представления данных на основе алгоритма tSNE.

    Старт
    21.03.2024
    Представление
    25.04.2024
    Постерная сессия
    11.06.2024
    Защита
    05.11.2024 – 15.11.2024

    Паспорт проекта

    Аннотация

    В машинном обучении часто применяется алгоритм tSNE для визуализации данных. Данный алгоритм позволяет строить репрезентативные малоразмерные вложения данных, позволяя в некоторых случаях визуализировать кластеризацию данных. Одним из недостатков данного алгоритма является вычисление признаков для точек, которых не было в обучающей выборке: для каждой новой точки необходимо заново обучать всю модель. Последнее обстоятельство крайне неудобно на практике: помимо высоких вычислительных затрат под...

    Отрасль

    Информатика

    Теги

    Информатика

    Цель

    Разработка алгоритма обучения нейросети для построения вложения датасета в пространство меньшей размерности на основе алгоритма tSNE. Исследование сходимости разработанного метода при увеличении обучающей выборки.

    Ожидаемые результаты

    • Формулировка задачи построения вложения на языке теории вероятностей и математической статистики.
      • Разработка архитектуры нейронной сети и алгоритма обучения для построения вложения, аналогичного классическому tSNE.
        • Применение разработанного алгоритма на реальных и синтетических данных.

          Форма и способы промежуточного контроля

          Еженедельные встречи с научным руководителем.

          Форма представления результатов

          Работа, готовая к публикации на конференции или в журнале.

          Ресурсное обеспечение

          Персональный компьютер студента, кластер ВШЭ. В качестве источников данных предлагается использовать самостоятельно сгенерированные синтетические данные, анонимизированный датасет из OK.ru

          Имеющийся задел

          Опыт научного руководителя в разработке аналогичного нейросетевого алгоритма для спектральной кластеризации,

          Заказчик

          НИУ ВШЭ / Заполнено автоматически