L2Central.info: Парсинг и перенос материалов Wiki-энциклопедии / Парсинг, перенос данных, Wiki, Content Downloader X1

Ссылка на работу
image image image image
По просьбе заказчика, с сайта-источника было обработано около 200.000 страниц, а также загружено около 140.000 медиафайлов. Обработанные материалы (шаблоны, статьи, изображения) были конвертированы в XML-формат для автоматизированного импорта на сайт заказчика. Сложность задачи состояла в том, что источник использует самостоятельно разработанные решения, которые недоступны для стандартного wiki-движка - возникла необходимость разработки сложной системы для обработки результатов парсинга. Решения, которые доступны для стандартного wiki-движка переносились без изменений. Разработка и непосредственно парсинг был выполнен на моей площадке. Дополнительных расходов на покупку или аренду Content Downloader X1 заказчик не понес.