Мне нужно техническое решение с api для того чтобы я мог встроить это в различные проекты как webrtc или еще как-то.
Суть проекта, есть файл изображения с человеком, нужно чтобы была веб страница чтобы можно было надиктовать туда вопрос, далее вопрос декодируется в текст и отправляется в Deepseek, далее получаем ответ, который необходимо озвучить, анимировать человека на изображении и наложить эту озвучку.
Всё должно работать быстро практически в режиме онлайн.
Не используя какие-то готовые сервисы и платформы которые могут быть платными или будет зависимость.
Единственная зависимость в этом проекте должен быть Deepseek, а всё остальное локальным решением, можно посмотреть открытые бесплатные проекты с Github если будут нужны.
Нужно чтобы система была гибкой и можно было при необходимости Deepseek поменять на OpenAi
В самом дипсике я запросил решение он мне выдал следующее: