AI-система матчинга резюме и вакансий под ключ: парсинг любых форматов из Telegram + векторный поиск

Ссылка на работу
image image image image image image
AI-система матчинга резюме и вакансий под ключ для HR-агентства. Резюме и вакансии собираются из Telegram вперемешку форматов (текст, PDF, DOCX, фото, скан). Задача: ручной разбор и сопоставление резюме с вакансиями не масштабируется — фото/сканы не ищутся, дубли из каналов, сопоставление вручную. Решение — конвейер от сообщения до готовой пары: — Сбор: userbot Telethon, кэш и дедуп. — Парсинг любых форматов: LLM (текст), pdfplumber (PDF), DOCX, OCR через LLM Vision (фото/сканы). LLM приводит к единой структуре и анонимизирует резюме. — Матчинг векторный: эмбеддинг 1536d в pgvector, косинусное расстояние (порог настраивается), фильтр неактивных — совпадение по смыслу, не по ключевым словам. — Фон/реалтайм: Celery + Redis, лента по WebSocket. — Дашборд React 19: лента со score, модерация горячими клавишами, отправка нанимателю. UI и девопс (Docker, nginx, CI/CD GitLab, 304 теста) — тоже мои. Результат: резюме любого формата попадает в поиск; матчинг по смыслу; реалтайм-лента с модерацией в клик. Production-уровень. Стек: Python · FastAPI · pgvector · Telethon · OpenAI/Gemini · React 19 · Docker · GitLab CI