Идеальный конечный результат:
- Удаление речи интервьюера из текста
Исходники:
- ai транскрибация интервью обычных людей, или знаменитостей текст
(с делением на спикеров, от 20 до 50 т знаков с пробелами)
- mp4 исходник
Особенности предоставляемой ai транскрибации:
- ai ошибается и меняет маркировку интервьюера на человека, добавляет новые души, как в примере (ведущий, комментарист и тп)
* Примеры Исходника и Результата прикрепил к задаче
______
Детали:
- Литературной обработки не требуется
- Все косноязычие, слова паразиты, жаргонизмы, ругательства и тп должны остаться в первозданном виде
- Если ai пропустил в тексте слово, которое отчетливо слышно, его надо вернуть в текст (таких случаев мало)
- Если ai изменил исходное слово, его надо вернуть к исходнику. Это бывает редко и хорошо заметно на словах не соответствующих контексту.
- Из пунктуации важны только точки в конце предложения.
Остальная пунктуация и знаки препинания не играют роли, оставляем, как в исходнике
- Если в исходной транскрибации таймкодом разбита на абзацы незаконченная речь человека, удаляем такое разбиение и таймкод, соединяя ответ (в примере указано красными стрелками)
- Все имена, которые человек произносит в ответе оставляем.
> В результате нужно два текстовых файла:
№1 только абзацы с ответами человека и таймкодами без маркировки Спикера
№2 только абзацы с ответами человека Без таймкодов и других маркировок
____
Для принятия решения, сообщите пожалуйста:
1) Стоимость обработки за 1000 знаков с пробелами исходной транскрибации
2) Среднюю скорость готовности одного интервью с 30т. исходных знаков
* экстренной срочности не требуется, в обычном режиме.
Результаты в файлах MS Word
(читаемый MS Office 7)
Первый заказ будет на обработку 3-5 таких интервью.
Далее периодические заказы в разных количествах (от 1 до 10 штук)
* результат вашей работы будет обезличен и использован для исследований в области семантики речи. Все в рамках закона.
Опубликован 23.11.2025 в 17:46
Заказ находится в архиве