Парсер каталога интернет-магазинов: товары, цены и фото в готовый CSV для импорта
Для кого: интернет-магазинам и поставщикам, у кого каталог (товары, цены,
характеристики, фото) живёт на сайте, а нужен в структурированном виде — для переноса
в другую CMS, обновления, сравнения цен или загрузки в учётную систему.
Что делает: собирает каталог целиком и формирует готовый к импорту файл.
Поток: каталог сайта → парсинг карточек → нормализация → CSV под вашу CMS.
С каждой карточки тяну: название, описание, цену, характеристики (таблицей),
галерею фото, категорию, производителя, артикул. Картинки скачиваю и переименовываю.
Умные цены: если прайс приходит отдельным файлом (Excel), подтягиваю цены к товарам
нечётким сопоставлением названий (fuzzy matching) — совпадает даже при разном написании,
с колонкой проверки «откуда взята цена».
Надёжность: возобновляемый прогон (после обрыва продолжает, а не начинает заново),
аккуратная обработка ошибок (не падает на битой карточке), соблюдает лимиты источника.
На реальном проекте — каталог ~250 товаров с выгрузкой под импорт в JoomShopping.
Работаю через Безопасную сделку, результат показываю до оплаты.
Стек: Python, httpx, BeautifulSoup, pandas.