По просьбе заказчика, с сайта-источника было обработано около 200.000 страниц, а также загружено около 140.000 медиафайлов. Обработанные материалы (шаблоны, статьи, изображения) были конвертированы в XML-формат для автоматизированного импорта на сайт заказчика.
Сложность задачи состояла в том, что источник использует самостоятельно разработанные решения, которые недоступны для стандартного wiki-движка - возникла необходимость разработки сложной системы для обработки результатов парсинга. Решения, которые доступны для стандартного wiki-движка переносились без изменений.
Разработка и непосредственно парсинг был выполнен на моей площадке. Дополнительных расходов на покупку или аренду Content Downloader X1 заказчик не понес.