Требуется парсер только по OK.ru.
Парсер-бот просматривает мои фотографии, находит те, к которым с предыдущего цикла обработки были написаны новые комментарии. Тогда парсер выдергивает: подпись под комментируемой фотографией, новый/новые комментарии, ID авторов этих комментариев; пишет ответ на эти комментарии "ок". Далее парсер-ботом формируется отчетный файл по определенному шаблону (прилагается). В отчетный файл вносится: ID автора, его старое название (ведется отдельный автоматически обновляемый дата-файл писавших когда-либо авторов. поля: ID, первое имя, последнее имя, пояснения), комментарий к фото, часть подписи к фото по маске и часть комментария по маске. В отчетный файл должны заноситься только новые записи. Всем записям одного автора в отчетном файле в одном цикле работы парсера присваивается один номер. Для нумерации записей используются нечетные числа. Отчетный файл и справочник авторов создаются в xls или csv. Если Парсер-бот использует для работы стороннее специфичное ПО, то надо, чтобы была рабочая версия "установил и забыл" без бесконечных триалов, либо пользовательская лицензия за ваш счет. Среднее время цикла просмотра/обработки парсером комментариев порядка 5000 фотографий не должно превышать 8часов (на связке Atom+2Gb+Eth3mB/c). Предполагается, что Парсер-бот будет работать круглосуточно. Парсер должен всю деятельность вести только в пределах моей (моих) страницы. Парсер-бот не должен логиниться 100500 раз в сутки. Сроки: неделя с момента последней редакции данного задания для основной части и на доводку по договоренности.
Опубликован 27.08.2015 в 15:31
Заказ находится в архиве