Завершен
2021 / 2022

1052 Приложение для оцифровки аудиозаписи в текстовый формат
Старт
15.01.2022
Представление
28.01.2022
Постерная сессия
18.04.2022
Защита
13.05.2022
Паспорт проекта
Аннотация
В ходе проекта разрабатывается движок и API для приложения, предназначенного для преобразования диалогов из аудио формата в текстовый, с возможностью распознавания различных голосов.
В ходе анализа аналогов были рассмотрели приложения, доступные в App Store и выявлены следующие недостатки.
Приложение “Odrey” работает только с английским языком и имеет ограничение длины аудиозаписи в бесплатной версии.
Приложение “Textr” бесплатно работает только с короткими аудиозаписями.
Приложение...
Отрасль
Информатика
Теги
Информатика
Цель
Предоставить возможность автоматизированного создания протокола встреч и звонков.
Ожидаемые результаты
- Движок и API для мобильного приложения и/или веб сервиса, принимающий на вход аудиофайл и генерирующеий транскрибацию диалогов с разделением на реплики, сказанные разными людьми.
- Принцип работы:
- Программная часть представляет собой нейронную сеть, преобразующую аудиозаписи в текстовый формат с возможностью разделения текста на реплики принадлежащие разным собеседникам, различая их по голосам.
Форма и способы промежуточного контроля
Разработка и согласование ТЗ и календарного плана.
Тест работоспособности системы на ключевых этапах разработки по плану.
Еженедельные промежуточные отчеты по проделанной работе.
Форма представления результатов
Исходный код в репозитории.
Демонстрация работы приложения на тестовых данных.
Отчет по проделанной работе с выводами.
Ресурсное обеспечение
ПК с производительным дискретным графическим ускорителем или облачный сервис обучения нейронных сетей.
Имеющийся задел
Знания теории построения и обучения нейросетей.
Заказчик
Организация / Студия ИОС