Ищем специалиста по дообучению ИИ на документах
Нам нужен человек, который поможет нам разобраться в процессе дообучения языковой модели (LLM) на основе внутренних документов (PDF, DOCX, TXT и др.).
Задача:
Провести виде созвон (30–60 минут), на котором пошагово объяснить:
Как устроен процесс дообучения или адаптации модели на текстах.
Чем отличаются fine-tuning, RAG, embeddings и другие подходы.
Какие инструменты и библиотеки использовать (напр., HuggingFace, LangChain, Ollama и т.д.).
Как подготовить данные: очистка, структура, формат.
Как реализовать всё локально или в облаке, в зависимости от цели.
Что важно:
Практический опыт в дообучении LLM (GPT, LLaMA, Mistral и пр.).
Понимание различий между fine-tuning, instruction tuning, LoRA и пр.
Умение объяснять простыми словами.
Приветствуется: опыт работы с векторными БД (Qdrant, FAISS), API-интеграцией и оптимизацией inference.
Формат работы:
Один-два созвона, возможна краткая письменная инструкция после общения.
Цель:
Понять, какой подход подходит нам, и как его реализовать.
Разделы:
Опубликован:
16.06.2025 | 14:47
Заказ находится в архиве