Подключите нашего Telegram-бота для уведомлений о новых проектах

Заказ закрыт
Разработка локального TTS (синтеза речи) под мой голос

Разместить заказ
s
Заказчик
Отзывы фрилансеров: + 0 - 0
Зарегистрирован на сайте 4 года
Бюджет: по договоренности
Задача: Обучить нейросеть на моих голосовых данных (30 минут дикторской записи) для синтеза речи в реальном времени.
Локальность: Полностью оффлайн-решение (без API, cloud и т.д.).
Платформа: Windows/Linux (есть GPU).
Задержка: Минимизировать (в идеале <1 сек).
Интеграция: Готовый Python-модуль или API для голосового робота.

2. Технологии (на выбор исполнителя)
Предпочтительные фреймворки:
Coqui TTS (VITS)
Silero (если хватит качества)
VITS / VALL-E (если исполнитель уверен в результате)

Оптимизация: ONNX, TensorRT или квантизация для ускорения.

3. Данные
30 минут чистого аудио (формат WAV, 16 kHz, моно).

Пример текста для обучения прилагается.

4. Этапы работы
Анализ данных – проверка пригодности записей.
Обучение модели – fine-tuning выбранного TTS.
Тестирование – оценка натуральности и задержки.
Интеграция – выгрузка модели в рабочий формат + пример кода для запуска.
Разделы:
Опубликован:
04.05.2025 | 18:53 [поднят: 04.05.2025 | 18:53]
Заказ находится в архиве
Откликнуться Посмотреть другие заказы

Теги:

Наши партнеры
Сведения об ООО «Ваан» внесены в реестр аккредитованных организаций, осуществляющих деятельность в области информационных технологий. ООО «Ваан» осуществляет деятельность, связанную с использованием информационных технологий, по разработке компьютерного программного обеспечения, предоставлению доступа к программе для ЭВМ и является правообладателем программы для ЭВМ «Платформа FL.ru (версия 2.0)».