Логотип МИЭМ НИУ ВШЭ
Завершен
Логотип типа проекта Программный
Программный
2022 / 2023
Логотип проекта Исследование применения технологии переноса тембра голоса

    1479 Исследование применения технологии переноса тембра голоса

    Старт
    16.01.2023
    Представление
    01.02.2023
    Постерная сессия
    17.04.2023
    Защита
    08.06.2023

    Паспорт проекта

    Аннотация

    В данный момент все большее распространение получают различные нейросетевые алгоритмы генерации искусственных данных. В частности, задача генерации и обработки звука является одним из перспективных направлений развития нейросетевых технологий. Технология синтеза речи из текста имеет огромное распространение и существует уже давно, но при этом все еще продолжает развиваться. В то же время, нейросетевые методы клонирования голоса возникли сравнительно недавно, но, как и многие другие методы...

    Отрасль

    Информатика

    Теги

    Информатика

    Цель

    Целью проекта является исследование нейросетевых методов для переноса тембра голоса и создание прототипа прораммы с таким функционалом.

    Ожидаемые результаты

    • Проведенное исследование методов обработки звука, различных нейросетевых алгоритмов синтеза речи, а также нейросетевых методов переноса голоса и особенностей звука.
      • Реализация вышеописанных алгоритмов и сравнение с существующими аналогами
        • Создание прототипа программы
          • Научная статья

            Форма и способы промежуточного контроля

            Внутренний отчет и презентация руководителю проекта

            Форма представления результатов

            Отчет по проекту, научная статья в рецензируемом журнале, презентация на научной конференции (в зависимости от качества и количества результатов)

            Ресурсное обеспечение

            Нет

            Имеющийся задел

            Нет

            Заказчик

            МИЭМ / ДЭИ