Python-разработчик с опытом в RAG/LLM (Python Backend (AI/RAG) LLM Engineer)

Бюджет: по договоренности
Разработать и развернуть self-hosted веб-сервис (RAG-архитектура), который позволяет ученикам онлайн-курса задавать текстовые вопросы и получать ответы исключительно на основе загруженной базы знаний. Сервис должен работать в браузере, без установки приложений, без платных подписок для пользователей и без необходимости использования VPN на территории РФ.
технологический стек: FastAPI + vLLM/Ollama + Qdrant/Weaviate + Redis + Docker
Опыт настройки rate limiting и горизонтального масштабирования инференса
Большая просьба, откликайтесь только если у вас уже есть опыт развертывания такого продукта и вы можете предоставить портфолио, указывайте ориентировочную стоимость вашей работы. Сроки: 3-4 недели на разработку (после согласования тз), 1-2 недели на доработку и тестирование.
Опубликован 06.05.2026 в 18:36

Выберите способ верификации:

Обновите страницу после прохождения верификации.