Логотип МИЭМ НИУ ВШЭ
Завершен
Логотип типа проекта Научно-исследовательская работа
Научно-исследовательская работа
2022 / 2023
Логотип проекта Применение вариационного автокодировщика для генетического популяционного анализа

    710 Применение вариационного автокодировщика для генетического популяционного анализа

    Старт
    19.01.2023
    Представление
    02.02.2023
    Постерная сессия
    17.04.2023
    Защита
    08.06.2023

    Паспорт проекта

    Аннотация

    Метод главных компонент (PCA) является одним из наиболее используемых интсрументов качественного анализа и визуализации генетических данных в популяционной генетике. Вариационные автокодировщики - подход из глубокго машинного обучения, позволяющий проводить нелинейный анализ данных аналогично методу главных компонент. В рамках проекта будет изучена возможность и целесообразность использования такого подхода к практическим задачам. Вариационные автокодировщики позволяют лучше отделять...

    Отрасль

    Информатика

    Теги

    Информатика

    Цель

    Изучение различных методов кластеризации данных для визуализации структуры популяции в популяционной генетике.

    Ожидаемые результаты

    • На втором этапе необходимо исследовать применение других методов кластеризации для популяционного анализа генетических данных. Также необходимо изучить возможность оценки пропорций перемешивания на основе результатов кластеризации исследуемыми методами.

      Форма и способы промежуточного контроля

      Еженедельные личные встречи, отчёты.

      Форма представления результатов

      Отчёт, несколько глав для черновика статьи по результатам исследования, программный код на GitHub.

      Ресурсное обеспечение

      Суперкомпьютер НИУ ВШЭ, библиотека НИУ ВШЭ, ресурсы международной лаборатории статистической и вычислительной геномики.

      Имеющийся задел

      На прошлом этапе работ было исследовано применение вариационных автокодировщиков с евклидовым и гиперболическим латентными пространствами для кластеризации генетических данных с целью визуализации структуры популяции. Проведено сравнение с методом главных компонент, который является одним из основных инструментов в популяционной генетике. По результатам опубликована конференционная статья Bogdanov, Shchur, "Variational Autoencoders with Euclidean and Hyperbolic Latent Spaces for Population...

      Заказчик

      НИУ ВШЭ / Международная лаборатория статистической и вычислительной геномики