Логотип МИЭМ НИУ ВШЭ
Завершен
Логотип типа проекта Научно-исследовательская работа
Научно-исследовательская работа
2022 / 2023
Логотип проекта Технология разделения аудиосигнала на источники
    От компании

1371 Технология разделения аудиосигнала на источники

Старт
03.11.2022
Представление
23.01.2023
Постерная сессия
17.04.2023
Защита
07.06.2023

Паспорт проекта

Аннотация

Решение задачи эффективного разделения аудиопотоков широко применяется в системах видеоконференцсвязи как для целей шумоподавления, так и для транскрибации речи для формирования субтитров.

Отрасль

Информатика

Теги

Информатика

Цель

Исследование и реализация алгоритмов разделения аудиопотока на несколько по набору заданных параметров

Ожидаемые результаты

  • - математическая модель для разделения аудиопотока с качеством SDR >10
    • - требования по скорости работы: 1/50 с на обработку 1 с аудио на GPU Tesla T4

      Форма и способы промежуточного контроля

      - представление и обсуждение текущих результатов с заказчиком не реже, чем 1 раз в 2 недели - выступление на научных семинарах на площадках заказчика и в НИУ ВШЭ

      Форма представления результатов

      - отчет НИР - репозиторий с исходным кодом с комплектом документации

      Ресурсное обеспечение

      Доступ к необходимым вычислительным ресурсам может быть предоставлен заказчиком проекта по запросу (хранилище, GPU).

      Имеющийся задел

      Материалы предоставляются заказчиком. Проект сопровождается экспертом со стороны заказчика.

      Заказчик

      Организация / Компания "VK"