PHP-парсер для подсчета вхождения списка сключевых слов

Бюджет: по договоренности
Нужен простой скрипт, который бы принимал на вход два списка (список URL страниц и список ключевых слов), на выходе выдавал бы CSV-таблицу, в которой для каждой страницы подсчитывал бы количество вхождений каждого из ключевых слов.  

Формат выходного файла: в строках- страницы, в столбцах – ключевые слова (первый столбец – URL страницы). Название файла уникальное (дата-время) – ничего не удаляется. Все файлы записываются в папку output в том же месте, где скрипт.

Поиск регистронезависимый, поиск осуществляется по контенту страницы (внутри тэга <body>, но не важно в каком тэге).  

Никакого особенного фронтенда не надо. Списки URL и ключевых слов –  в двух отдельных текстовых файлах (каждый элемент на новой строке), лежащих в фиксированном месте, рядом со скриптом. Скрипт может запускаться через web-браузер или curl. На выходе должен написать количество обработанных URL и ошибки, если таковые случались.

Спасибо!
Опубликован 31.01.2016 в 11:46

Выберите способ верификации:

Обновите страницу после прохождения верификации.