AI-помощник по банковским регламентам: ответы на вопросы со ссылками на источники

Ссылка на работу
image image image
Проект выполнен как демонстрационная end-to-end RAG-система для банковской сферы: работы с нормативными документами, внутренними регламентами и CIB-документами. Система предназначена для сотрудников банка или корпоративного подразделения, которым нужно быстро находить информацию в большом наборе документов и получать ответы на естественном языке с опорой на релевантные источники. В проекте реализован полный цикл подготовки данных: парсинг реальных нормативных документов, генерация синтетических внутренних регламентов, генерация QA-наборов, валидация, разбиение документов на чанки и индексация. Подготовленный корпус включает 17 реальных распарсенных регламентов, 18 синтетических внутренних документов, 18 наборов вопросов и 35 файлов чанков. Для поиска используется hybrid retrieval: семантический поиск в ChromaDB, BM25 по кластерным индексам и объединение результатов через Reciprocal Rank Fusion. Такой подход позволяет учитывать как смысловую близость запроса, так и точные совпадения по терминам, что особенно важно для юридических, банковских и регуляторных документов. Результат: получилась полноценная RAG-система с подготовкой корпуса, гибридным поиском, backend API, frontend-интерфейсом, логированием, dashboard и offline evaluation. Проект показывает, как можно построить AI-ассистента для работы с банковскими документами и внутренней базой знаний.
https://github.com/ChernyackovEugeny/Banking_Knowledge_Assistant