Логотип МИЭМ НИУ ВШЭ
Завершен
Логотип типа проекта Научно-исследовательская работа
Научно-исследовательская работа
2023 / 2024
Логотип проекта Технология разделения аудиосигнала на источники
    От компании

1371 Технология разделения аудиосигнала на источники

Старт
21.11.2023
Представление
27.01.2024 – 07.02.2024
Постерная сессия
14.04.2024 – 25.04.2024
Защита
02.06.2024 – 13.06.2024

Паспорт проекта

Аннотация

Краткая аннотация проекта (общая информация о проекте) Начиная с 2015 года в рамках "Signal Separation Evaluation Campaign(SiSEC)", работа в MSS сфокусирована на обучении модели для разделения песни на 4 источника: "drums", "bass", "vocals" и "other" (все другие источники). Задача проекта заключается в приближении к общемировым результатам, с которыми можно ознакомиться здесь - https://paperswithcode.com/sota/music-source-separation-on-musdb18-hq. Проект ведется в Инженерно-математической...

Отрасль

Информатика

Теги

Информатика

Цель

Исследование и реализация алгоритмов для задачи MSS(Music Sourse Separation)

Ожидаемые результаты

  • 1. Создание улучшенной модели с качеством разделения на каждом источнике, не менее 6 SDR.
    • 2. Пайплайн для ускорения инференса модели.

      Форма и способы промежуточного контроля

      - представление и обсуждение текущих результатов с заказчиком не реже, чем 1 раз в 2 недели - выступление на научных семинарах на площадках заказчика и в НИУ ВШЭ

      Форма представления результатов

      - отчет НИР - репозиторий с исходным кодом с комплектом документации

      Ресурсное обеспечение

      Доступ к необходимым вычислительным ресурсам может быть предоставлен заказчиком проекта по запросу (хранилище, GPU).

      Имеющийся задел

      В рамках проекта было проверено несколько гипотез основанных на различных представлениях сигнала, на основании которых было реализовано несколько моделей. А также для процесса обучения моделей были разработаны различные методы расширения данных. Одна из моделей - PM-Unet, была представлена в статье, которая на данный момент принята на рецензирование для журнала IEEE Open Journal of Signal Processing.

      Заказчик

      Организация / VK