Бесплатно зарегистрируйся и получай уведомления о новых проектах по работе

Поделиться:

Автоматическая транскрибация(расшифровка) аудиозаписи

S
Заказчик
Отзывы фрилансеров: + 0 0 - 0
Зарегистрирован на сайте 9 лет и 1 месяц
Бюджет: 500 000 руб/заказ
8881.06 $ — 8632.45 €
Описание: Микрофон находится в комнате, в которой происходит массаж. Во время программы проигрывается музыка. Расстояние до магнитофона 2-5 метров, до гостя и массажистки 0.3-0.8 метра. Микрофоны Шорох-8, Мкуп-3, и др. запись производилась на систему Sp record.

ТЗ: Все аудиозаписи находятся на сервере в центральном офисе, ПО должно обрабатывать аудиозаписи и предоставлять после обработки, TXT файлы с диалогом находящихся в комнате.

Выполнение данного проекта видится следующим образом:
1. Очищение уже имеющихся аудио файлов от музыки и посторонних шумов
2. Разделение чистых файлов на отрезки по 20 секунд
3. Отправка на готовые трансрибаторы например (speechpad.ru)

Примеры аудиозаписей:
yadi.sk/d/G8w4nLsQ4HVWx
yadi.sk/d/bZQDMcWZ4HVWT

Готовы выслушать ваши предложения по реализации данного проекта.

Что уже делали и в чем возникла проблема:
сделали систему, обрабатывающая звуковые файлы, разбивающая звук на отрезки по 10 секунд и отправляющая все это дело на сервера расшифровки звука google (длинее записи гугл не воспринимал). Проблема (если на соединении 10 секунд звука со следующим треком было какое то слово оно терялось). Решили проблему таким образом: готовили второй звуковой файл, в котором весь звук сдвинут на +5 секунд.
И в принципе, как не странно, все это дело даже работало. Для теста прочитали стихотворение "русского поэта" непосредственно в сам микрофон находящийся в комнате для массажа (говорили прямо в сам микрофон на расстоянии 5-10 см от него). Никаких посторонних шумов в комнате не было. По результатам работы программы распозналось примерно 60-70% – в принципе суть была понятна...
Но столкнулись со следующей проблемой, если говорить не в сам микрофон, а на расстоянии метра от него, и при этом посторонние шумы в комнате, так же играет музыка – распознать невозможно вообще ничего.
На данный момент не можем решить проблему обработки звука для анализатора, т.е. звук нужно сделать в вариант (как будто мы говорим непосредственно в сам микрофон и все это дело автоматизировать).
Так же, если это поможет, можем треки играющие в комнате подготовить заранее (если поможет для обработки звука), все это подключить к программе которая при запуске на erp системе массажа (стойке администратора) запустит нужный трек в комнате с нужной громкостью. Данные о данном треке можем записать в базу данных (во сколько запустился трек, в какой комнате, время будет точное). Треки можно запускать с локального сервера, и запускать музыку в комнате по средствам планшета подключенного к базе (эту часть программы так же можем помочь в реализации).
Разделы:
Опубликован:
23.04.2013 | 15:49 [последние изменения: 23.04.2013 | 16:39]

Теги: нужен монтажер, ищу монтажера, резюме монтажера, требуется аудиомонтаж