О проекте
Мы развиваем и поддерживаем системы на базе Retrieval-Augmented Generation (RAG) — архитектуры, сочетающей возможности LLM и внешние базы знаний (векторные БД, поиск, документы и пр.).
Сейчас мы ищем Python-разработчика, который поможет нам поддерживать текущие RAG-решения, оптимизировать пайплайны, подключать новые источники данных и улучшать взаимодействие с LLM.
Обязанности
- Поддержка и развитие RAG-систем (OpenAI API);
- Интеграция внешних источников данных (документы, базы данных, API) в retrieval-часть;
- Работа с векторными базами данных (FAISS, Qdrant, Weaviate и др.);
- Оптимизация цепочек генерации, кеширования и оценки качества.
Требования
- Уверенное знание Python 3 и опыт разработки production-кода;
- Опыт работы с API современных LLM (OpenAI, Anthropic, Mistral и др.);
- Понимание архитектуры RAG-систем;
- Опыт работы с хотя бы одной векторной БД (Qdrant, FAISS, Milvus и др.);
- Владение Git, Docker, базовыми CI/CD.
Что мы предлагаем
- Работа с передовыми LLM-технологиями и RAG-архитектурами;
- Удалённый формат работы;
- Возможность влиять на архитектуру и выбор технологий;
- Гибкий график и комфортный рабочий процесс;
- Оформление по ТК.