📌 Цель:
Обеспечить корректную работу голосовых команд, воспроизведения аудиофайлов и взаимодействия с backend-частью, устранить текущие баги, проверить весь поток.
🛠 Технологический стек:
Frontend: HTML + JavaScript (в том числе Web Speech API)
Backend: Python (Flask)
📋 Функциональное описание:
Приложение позволяет пользователю (в том числе через голос) запрашивать:
🔊 воспроизведение аудиофайла из заранее подготовленной коллекции (сказки, песни и др.);
🧠 взаимодействие с ChatGPT через распознанную голосовую команду (STT → GPT → TTS).
🔧 Задачи на исправление
1. Ошибка воспроизведения аудиофайлов
Описание: При попытке воспроизведения любого аудиофайла (например, сказки) кнопка Play не работает.
Ожидаемый результат: По нажатию кнопки происходит воспроизведение соответствующего файла.
2. Ошибка передачи распознанной речи
Описание: Голос успешно распознаётся в браузере (видно в консоли), но текст не отправляется на сервер.
Ожидаемый результат: Распознанная команда (например, "Алиса/петя/вася, расскажи сказку про волка") передаётся на backend, где обрабатывается и возвращается соответствующий результат (аудиофайл).
3. Финальное тестирование всей цепочки
Проверить, что:
Микрофон активируется;
Речь распознаётся;
Команда отправляется на сервер;
Сервер возвращает аудиофайл;
Аудиофайл воспроизводится.
💬 Дополнительные условия
Поддержка всех предусмотренных языков (11 языков).
Поддержка всех вариантов ключевого слова активации: алиса, малиса, василиса и т.п.
Голосовая логика активируется только при наличии ключевого слова или при явном нажатии кнопки (например, “Поговорить с петей”).
P.S. ЕСЛИ НАДО, ПРИШЛЕМ ФАЙЛЫ
Разделы:
Опубликован:
20.06.2025 | 08:25 [поднят: 20.06.2025 | 08:25]
Заказ находится в архиве