Нужно приложение, которое поможет в работе корректора.
Приложение на вход получает адрес сайта.
На выходе нам нужно:
1. Карта сайта, со ссылками на все страницы
2. Применяет ко всем страницам конвертацию html > text, как в этом алгоритме примерно
3. Считает количество символов с пробелами на каждой странице. Оно отображается в скобках в карте сайте возле каждой страницы
4. Генерирует PDF файл. Сначала название сайта и статистика, сколько всего символов с пробелами. Потом карта сайта. при нажатии на страницы кидает в ту часть PDF файла, где идет текстовая версия страницы.
Перед началом каждой текстовой версии страницы ссылка на оригинальную страницу на сайте.
5. Генерирует csv файл, где одномерным массивом все найденные страницы (ссылки на них) и количество знаков с пробелами на каждой странице (после применения алгоритма конвертации)
Работать должно под виндой, можно и web