Завершен
2023 / 2024

1900 Примененние нейросетей для построения малоразмерного представления данных на основе алгоритма tSNE.
Старт
21.03.2024
Представление
25.04.2024
Постерная сессия
11.06.2024
Защита
05.11.2024 – 15.11.2024
Паспорт проекта
Аннотация
В машинном обучении часто применяется алгоритм tSNE для визуализации данных.
Данный алгоритм позволяет строить репрезентативные малоразмерные вложения данных,
позволяя в некоторых случаях визуализировать кластеризацию данных.
Одним из недостатков данного алгоритма является вычисление признаков для точек, которых не было в обучающей выборке: для каждой новой точки необходимо заново обучать всю модель.
Последнее обстоятельство крайне неудобно на практике: помимо высоких вычислительных затрат под...
Отрасль
Информатика
Теги
Информатика
Цель
Разработка алгоритма обучения нейросети для построения вложения датасета в пространство меньшей размерности на основе алгоритма tSNE. Исследование сходимости разработанного метода при увеличении обучающей выборки.
Ожидаемые результаты
- Формулировка задачи построения вложения на языке теории вероятностей и математической статистики.
- Разработка архитектуры нейронной сети и алгоритма обучения для построения вложения, аналогичного классическому tSNE.
- Применение разработанного алгоритма на реальных и синтетических данных.
Форма и способы промежуточного контроля
Еженедельные встречи с научным руководителем.
Форма представления результатов
Работа, готовая к публикации на конференции или в журнале.
Ресурсное обеспечение
Персональный компьютер студента, кластер ВШЭ. В качестве источников данных предлагается использовать самостоятельно сгенерированные синтетические данные, анонимизированный датасет из OK.ru
Имеющийся задел
Опыт научного руководителя в разработке аналогичного нейросетевого алгоритма для спектральной кластеризации,
Заказчик
НИУ ВШЭ / Заполнено автоматически