Завершен
2022 / 2023

710 Применение вариационного автокодировщика для генетического популяционного анализа
Старт
19.01.2023
Представление
02.02.2023
Постерная сессия
17.04.2023
Защита
08.06.2023
Паспорт проекта
Аннотация
Метод главных компонент (PCA) является одним из наиболее используемых интсрументов качественного анализа и визуализации генетических данных в популяционной генетике. Вариационные автокодировщики - подход из глубокго машинного обучения, позволяющий проводить нелинейный анализ данных аналогично методу главных компонент. В рамках проекта будет изучена возможность и целесообразность использования такого подхода к практическим задачам.
Вариационные автокодировщики позволяют лучше отделять...
Отрасль
Информатика
Теги
Информатика
Цель
Изучение различных методов кластеризации данных для визуализации структуры популяции в популяционной генетике.
Ожидаемые результаты
- На втором этапе необходимо исследовать применение других методов кластеризации для популяционного анализа генетических данных. Также необходимо изучить возможность оценки пропорций перемешивания на основе результатов кластеризации исследуемыми методами.
Форма и способы промежуточного контроля
Еженедельные личные встречи, отчёты.
Форма представления результатов
Отчёт, несколько глав для черновика статьи по результатам исследования, программный код на GitHub.
Ресурсное обеспечение
Суперкомпьютер НИУ ВШЭ, библиотека НИУ ВШЭ, ресурсы международной лаборатории статистической и вычислительной геномики.
Имеющийся задел
На прошлом этапе работ было исследовано применение вариационных автокодировщиков с евклидовым и гиперболическим латентными пространствами для кластеризации генетических данных с целью визуализации структуры популяции. Проведено сравнение с методом главных компонент, который является одним из основных инструментов в популяционной генетике. По результатам опубликована конференционная статья Bogdanov, Shchur, "Variational Autoencoders with Euclidean and Hyperbolic Latent Spaces for Population...
Заказчик
НИУ ВШЭ / Международная лаборатория статистической и вычислительной геномики