Настраиваемый парсер интернет-магазинов

Бюджет: 100 000 руб
1 314.86 $ – 1 115.75 €
Заказчик выбрал исполнителя:
Blockchain Developer  
Заключаем официальный договор (только Россия), возможно для ИП, ООО, физ-лиц. Оплата официально через банк. Через БС на сайте, к сожалению, не получится. Наш юрист считает, что нужен договор в котором прописано, что все права на разрабатываемый софт будет за нами, плюс разные налоговые риски.

Нужна реализация четко по заданию. Не надо писать, что парсеры будете делать под каждый магазин и считать стоимость 1 парсера.

Цель. Есть список товаров (около 1000, все 1 бренда), нужно выяснить по какой цене они выставлены на разных площадках и какие выставлены, какие не выставлены.

Архитектура – есть оболочка, там все настройки. Есть базовый настраиваемый парсер, 1 на все магазины, к которым он подойдет. Есть отдельные парсеры под специфические площадки и магазины. Используем прокси для защиты.

1. На вход подаём товары для поиска (бренд + артикул ). В большинстве случаев эта информация есть в названии товара на сайтах магазинов (для нужных мне товаров)
2. Указываем список магазинов
3. Настраиваемый парсер (указанный метод протестирован на десятке интересующих магазинов, все работает):
- Задаем параметры для каждого сайта магазина (например – шаблон поиска цены, шаблон поиска имени товара, шаблон 404й ошибки и т.д.)
- Указываем адрес поисковой строки на сайте
- парсер запускается в могопоточном режиме, сохраняет по заданным товарам: цену на сайте, есть/нет товар на сайте, дату проверки, адрес страницы. Парсер ходит по сайтам, эмулирует ввод нужного товара в поисковую строку сайта и анализирует результаты.
4. Подключаемые отдельные парсеры
- проработать механизм подключения
- разработать 2 парсера для market.yandex.ru и e-katalog.ru

Кратко так, подробнее – при обсуждении. Указывайте язык реализации, сроки/стоимость примерные. Потолок по бюджету указан.
Опубликован 30.04.2020 в 09:08 Последнее изменение: 30.04.2020 в 09:08

Выберите способ верификации:

Обновите страницу после прохождения верификации.