По договоренности
Необходимо сделать парсер автомобильного сайта. Нужно будет:
1) Вытащить из формы редактирования профиля список всех стран-городов (единоразово, наполнить базу);
2) Сделать робота, который будет обходить все машины на сайте. Берем список марок (сам список тоже нужно сохранять, и обновлять если он пополнится на сайте), по марке берем модель, получаем список машин, просматриваем все по очереди. По наличию определнного тэга на странице определяем интересна нам машина или нет, если да сохраняем в базу ее данные (URL, марка, модель, страна (в базе будет как ID в таблице стран), город, URL фотографии и до 5 доп. фотографий (если есть у машины), цена (число), валюта цены, описание, имя владельца). Если у машины нет тэга, но она раньше была у нас в базе удаляем.
Скрипт должен корректно отрабатывать ситуации если сайт станет недоступен, выдаст например 500ю ошибку и т.п. При этом нужно отправлять уведомление на имейл, и когда сайт вновь станет досупен продолжить сканирование с того места, где закончили. Нужно предусмотреть задержку между запросами, чтобы не дергать сервер слишком часто. Ф-ция запроса старинцы с сервера должна быть отдельной ф-цией/методом, чтобы ее легко можно было модифицировать (например поменять запрос с file_get_contents на cURL или сокеты).
За один запуск скрипт должен собирать информацию только об одной машине. Но при этом возможна ситуация что по крону скрипт вызовется раньше, чем доработает предыдущий. Соответственно, они не должны просматривать одновременно одну и ту же машину.
Никакие авторизации и пр. на сайте не требуются. Верстка простая и семантическая, так что проблем с парсингом быть не должно. Примерную структуру БД (по крайней мере таблицы и связи) предоставим.
Сайт и пр. информацию обговорим уже с выбранным разработчиком, думаю, описания выше будет достаточно для примерной оценки по стоимости и срокам.