Что нужно:
Есть рабочий чат-бот на GPT-4.1. Нужно подсоединить к нему базу знаний из двух PDF (ОГЭ + ЕГЭ, ~120 стр.) через Retrieval-Augmented Generation, чтобы ответы на вопросы об ОГЭ и ЕГЭ формировались из этих документов;
Дедлайн: 3 календарных дня с момента старта (строго до 26 июня 23:59 MSK).
Бюджет: 10 000 ₽
Техстек:
• Python 3.10+
• FAISS или Chroma для индекса эмбеддингов
• OpenAI API (text-embedding-3-small + GPT-4.1)
• FastAPI (добавить эндпоинт)
• Docker (+ docker-compose)
Что надо сделать
1. Чанкинг, эмбеддинг всех чанков, создание индекса.
2. Прослойка-роутер: при каждом запросе выбирать top-k (≤ 4) чанков и передавать в messages[] в роль `system/context`.
3. Smoke-тест: не менее 20 вопросов из ОГЭ/ЕГЭ, hit-rate ≥ 90 %.
4. README + команда `docker compose up` для локального запуска.
Готов ответить на все вопросы
Опубликован 21.06.2025 в 09:25 Последнее изменение: 21.06.2025 в 09:25
Заказ находится в архиве