Завершен
2023 / 2024

1371 Технология разделения аудиосигнала на источники
Королев Денис Александрович
руководитель проекта
Сластников Сергей Александрович
руководитель направления
Старт
21.11.2023
Представление
27.01.2024 – 07.02.2024
Постерная сессия
14.04.2024 – 25.04.2024
Защита
02.06.2024 – 13.06.2024
Паспорт проекта
Аннотация
Краткая аннотация проекта (общая информация о проекте) Начиная с 2015 года в рамках "Signal Separation Evaluation Campaign(SiSEC)", работа в MSS сфокусирована на обучении модели для разделения песни на 4 источника: "drums", "bass", "vocals" и "other" (все другие источники). Задача проекта заключается в приближении к общемировым результатам, с которыми можно ознакомиться здесь - https://paperswithcode.com/sota/music-source-separation-on-musdb18-hq.
Проект ведется в Инженерно-математической...
Отрасль
Информатика
Теги
Информатика
Цель
Исследование и реализация алгоритмов для задачи MSS(Music Sourse Separation)
Ожидаемые результаты
- 1. Создание улучшенной модели с качеством разделения на каждом источнике, не менее 6 SDR.
- 2. Пайплайн для ускорения инференса модели.
Форма и способы промежуточного контроля
- представление и обсуждение текущих результатов с заказчиком не реже, чем 1 раз в 2 недели
- выступление на научных семинарах на площадках заказчика и в НИУ ВШЭ
Форма представления результатов
- отчет НИР
- репозиторий с исходным кодом с комплектом документации
Ресурсное обеспечение
Доступ к необходимым вычислительным ресурсам может быть предоставлен заказчиком проекта по запросу (хранилище, GPU).
Имеющийся задел
В рамках проекта было проверено несколько гипотез основанных на различных представлениях сигнала, на основании которых было реализовано несколько моделей. А также для процесса обучения моделей были разработаны различные методы расширения данных.
Одна из моделей - PM-Unet, была представлена в статье, которая на данный момент принята на рецензирование для журнала IEEE Open Journal of Signal Processing.
Заказчик
Организация / VK