http://goo.gl/xc6vU - сайт керамической плитки. На входе парсера: разделы каталога. На выходе: список характеристик брендов, коллекций, товаров в формате CSV. Скачиваются изображения для каждого наименования. Есть возможность скачивать данные через прокси сервера, в несколько потоков.
http://goo.gl/15yWm - сайт вакансий. На входе парсера: требуемые отрасли, интервал дат резюме. На выходе - список данных резюме в формате CSV: имя;email;телефон. Каждому автору резюме отправляется email сообщение.
http://goo.gl/bHQz4 - сайт японской косметики. Парсер собирает характеристики всех товаров в формате CSV и скачивает изображения.
http://goo.gl/oWOja - сайт ковров. На сайте характеристика товара представлена одной строкой, без структуры. Парсер выделяет каждую характеристику (артикул, состав, цена и т.д.) и сохраняет ее в отдельный столбец CSV. Так же скачиваются изображения (максимально возможный размер). На выходе - все товары в CSV + изображения.
http://goo.gl/esNhj - сайт японских кухонных ножей. Для каждого типа товара (ножи, посуда, точильные камни и т.д.) сохраняется отдельный CSV файл со всеми характеристиками. Скачиваются изображения товаров.
http://goo.gl/wm37a - сайт искусственных камней. Данные о товарах сохраняются в формат CSV. Так же сохраняются изображения.
http://goo.gl/IWbLW - сайт статистики. Данные всех дат сохраняются в формат CSV.