image
формирует страниц на основе поиска гугла: keyphrase site:domain. на входе список кейфраз. на выходе - набор хтмл страниц в каталоге или локально, как вам удобнее. урл страницы - кейфраза (транслит, если фраза по-русски). выделения em гугла заменяет на strong. убрать строку метадаты, опция сохранить линки. 20 результатов на страницу. вверху страницы - кейфраза в h1. также формируется карту с урлами страниц и кейфразами в анкоре. страницы перелинкованы между собой в пределах одного кейворда и между кейвордами учитывает существование ограничения на предельное время работы скриптов на сервере. если список кейфраз прогоняется повторно, предыдущие файлы затираются. опция подстановки урл в линки. например, при парсинге site:domain.org заменять линки на domain.com (domain.org/xxx.htm -> domain1.com/xxx.htm) опция nofollow в линки остановка скрипта и продолжение с заданного места, индикация работы. предусмотреть обрывы - скрипт должен продолжать с места остановки. задаем глубину парсинга: N страниц по M результатов по каждой кейфразе.