Нужно разработать скрипт (PHP) для создания файла sitemap.xml (
Скрипт должен оформлен в виде класса
include("./sitemap.class.php");
$sitemap = new sitemap();
Скрипт на входе получает
1) URL сайта, где протокол может быть http, https, домены в зоне рф (в кириллице)
$sitemap->get_links('
'); // '
'
2) Кол-во страниц которые нужно обработать.
$sitemap->num(100);
3) TimeOut время после которого скрипт прекращает работу, НО при этом выдавая собранный материал.
$sitemap->timeout(5000);
4) Массив игнорируемый ссылок:
$sitemap->set_ignore(array("javascript:", ".css", ".js", ".ico", ".jpg", ".png", ".jpeg", ".swf", ".gif"));
Скрипт должен нормально отрабатывать на большинстве сайтов в рекурсивном варианте, с учетом нагрузки.
Входные параметры:
1) URL сайта
2) Limit на количество страниц (после чего завершает работу) 0 пока не пройдет все ссылки.
3) IgnorList запрет на внешние ссылки и ссылки из набора (.js .css .pdf .swf, итд)
4)TimeOut время работы скрипта.
На выходе класс должен иметь 3 функции:
1) $sitemap->get_array() массив со ссылками на страницы
2) $sitemap->asXML() переменную c XML данными (без сохранения файла)
3) $sitemap->numReady() -Количество обработанных строк
Тестирование:
На своем сервере вы создаете форму с полями
1) URL
2) LIMIT (0-500)
3) TIMEOUT
На выходе должен быть массив или XML файл.