====================
1) ТЗ с картинками доступно по этой ссылке
vladimir-gusev.notion.sit... 2) Можно взять в работу не все сайты сразу, а, например, только ВК.
====================
Есть набор исходных ссылок на сайты со справочными материалами, например:
yandex.ru/support/direct/ yandex.ru/support/metrica... yandex.ru/adv/edu/materia... help.elama.ru/ elama.ru/blog/ и т.п.
Все эти сайты содержат статьи, хелпы и справки. Необходимо рекурсивно обойти все внутренние ресурсы (ссылки) со статьями, справками и т.д. и сохранить в файлы эти страницы в форматах pdf и html.
Файлы для каждого сайта необходимо сохранять в отдельные папки.
В каждой папке необходимо наличие файла, например excel таблицы, описывающей связи сохранённых файлов и исходных ссылок на web страницу.
Ожидаемый результат:
Разбитые по папкам сохранённые в файлы web страницы в форматах html и pdf