Необходимо написать скрипт функцией которого является мониторинг индексации Гуглом сайта.
Требуется, чтобы:
1) По крону скрипт запускался и проверял степень индексации сайта, указанного как параметр конфига (можно прямо в начале скрипта вручную захардкодить).
2) Результат проверки (текущее кол-во страниц в индекса) записывался в базу (sqlite).
3) Производилась сверка с предыдущей проверкой и выяснялось: что было добавлено в индекс/что было исключено.
4) Информация о появившихся или исчезнувших страницах индекса записывалась в файл построчно в формате лога, например:
"Сайт example.ru, страница
появилась в выдаче
Сайт example.ru, страница
исчезла из выдачи"
5) После проверок и записи лога старая проверка удаляется из базы и ожидается очередной запуск, чтобы сравнивать индекс уже с проверкой текущей итерации.
И т.д. процесс длится регулярно. Частота обновления данных не чаще, чем раз в 1-2 часа (нужно понять будут ли каптчи или можно это не учитывать).
От кандидатов нужна информация:
1) Сроки исполнения
2) Расценку
Предпочтение будет отдаваться идеальному соотношению скорость/цена.