ML-алгоритм дедупликации SKU для маркетплейсов

Ссылка на работу
image image image image
🚀 Интеллектуальная система матчинга товаров (AI Matching Engine) Разработал высокоточное решение для автоматизации модерации и поиска дублей в крупных каталогах E-commerce. 📌 Задача: Автоматизировать процесс выявления идентичных товаров, используя разрозненные данные: названия, характеристики и фотографии. Ручная обработка таких объемов (Big Data) неэффективна и ведет к ошибкам. 🛠 Технологический стек: Система построена на мультимодальном подходе — ИИ анализирует объект сразу в трех плоскостях: • NLP (BERT/T5): Глубокий семантический анализ текстов и выявление смыслового сходства. • Computer Vision (ResNet/EfficientNet): Сравнение визуальных дескрипторов изображений. • Machine Learning (CatBoost/AutoGluon): Финальное ранжирование через ансамбли моделей на базе 50+ признаков. 📈 Результаты и бизнес-ценность: ✅ Точность (ROC-AUC): 0.9216 — минимальный риск пропуска дублей. ✅ Масштабируемость: Обработка 100 000+ товарных пар в час. ✅ Экономия: Сокращение операционных расходов на модерацию до 80%. ✅ Чистота данных: Исключение каннибализации трафика из-за дубликатов в поиске. Это готовое Enterprise-решение, которое можно адаптировать под любую нишу: от электроники до одежды. 🤝 Нужна автоматизация вашего бизнеса или внедрение ИИ? Напишите мне в личные сообщения или Telegram — обсудим ваш проект и подберем оптимальную архитектуру под ваши задачи.
https://github.com/QurusX/Product-Matching-Engine