Краудер+Парсер рекламных размещений на порталах

Бюджет: по договоренности
Необходимо написать новый скрипт или адаптировать существующий который бы смотрел порталы и следил за появлением новой  рекламы, а точнее рекламодателей на них. Отслеживаемая реклама на порталах представлена баннерами и тексто-графическими блоками. 

1. Есть список url которые скачивания и сканируем: порядка 30 сайтов с 2-3 url на каждом (по скольку общего стандарта рекламный материалов нет придётся для каждого сайта как то описать те форматы размещения, точнее как выглядит их html код)
2. Смотрим исходящие ссылки и сохраняем их, сохраняем картинки и тексты (ТГБ, ссылка не просто внутри текста).
3. Сравнение ссылки из рекламы с теми что были в течении последних 2х месяцах, чтобы выявить новые
4. На выходе выходе должна был показана информация какие размещения есть по всем площадкам и какие являются новыми, вывод можно делать например в виде таблицы которую смотришь через гугл докс.
Проход сайтов делаем раз в 3 дня, реализация лучше ввиде не десктоп, а серверной реализации (к примеру php+mysql)

В комменты можно написать примеры подобных работ, в личку расценки и сроки.
Опубликован 17.03.2016 в 17:34

Выберите способ верификации:

Обновите страницу после прохождения верификации.