EmbeddingStudio | Инструмент для умного поиска по документам и данным
Участвовал в разработке EmbeddingStudio в роли Head ML Engineer. Это платформа для умного поиска по данным компании: документам, товарам, изображениям, текстам, каталогам и другим материалам.
Главная задача проекта — сделать поиск не только по совпадению слов, а по смыслу запроса. Пользователь может написать запрос обычным языком, а система понимает, что именно он ищет: объект, тему, категорию, ограничения, свойства и нужные фильтры.
Отдельно работал над ML-частью поиска: embedding-моделями, векторным поиском, качеством выдачи и логикой разбора пользовательских запросов. Система помогает превращать неточный текстовый запрос в более точный поиск: выделять важные параметры, учитывать фильтры, понимать намерение пользователя и находить релевантные результаты даже без полного совпадения слов.
Также в проекте была реализована логика автоулучшения поиска. Система собирает действия пользователей: клики, выбранные результаты, пропущенные варианты и другие сигналы. На основе этого поиск может становиться точнее со временем и лучше подстраиваться под реальные запросы пользователей.
В результате бизнес получает поиск, который лучше понимает людей, быстрее находит нужные документы, товары или изображения, учитывает фильтры и постепенно улучшает качество выдачи на основе поведения пользователей.