есть список из магазинов (30 штук), цены которых нужно отслеживать по товарам. Предварительное краткое ТЗ:
1) Дан список товаров (1000-5000) товаров для анализа, для простоты наш магазин включен в список магазинов (30 штук).
2) Для этого списка товаров для каждого товара указываются простые правила для однозначного нахождения и идентификации этого товара в разных магазинах (название и описание товаров то может быть разное), например:
телевизор Sony 25XKR будет определяться, как интересующий нас продукт, при совпадении в названии слова "sony" и слова "25" и слова "XK(R)", где скопки, указывают на то, что R может быть слитна к XK может быть через тире, подчеркиванием или находится рядом в 2 символах.
Особенности работы такого алгоритма, а они будут, уточнять правилами для конкретного магазина
3) Для каждого магазина составляется некий шаблон, в котором указано, где каталог и где у него категории и где сами товары, в этом шаблоне так же указывается "откуда и до куда брать описание товара" кроме цен потребуется само название и описание товара для каждого сайта, чтобы, при необходимости, проверить, тот ли товар и верно ли определился
4) Должна быть возможность запускать несколько потоков (например те же 30 потоков по одному для магазина), а так же установка паузы между запросами к одному магазину.
5) Должна быть обеспечена примитиваня самопроверка чтобы корректно обрабатывались ошибки вместо нулевых цен, или "na" должны выводится ошибки либо сайт недоступен, либо цена не найдена"
6) возможность работы через прокси (впринципе такой модуль на php уже есть, надо только связать его со скриптом)
7) при сохранении данных о позициях должна быть история, и, как следствие, указание динамики цен для магазинов
На почту coder2500@mail.ru прошу прислать примерную оценку скрипта, понятно, что при утверждении ТЗ, цена может будет другой.
Предпочтительно: php+mysql
опыт написания аналогичных скриптов обязателен.
Сергей Юрьевич
Опубликован 19.03.2010 в 19:26