Парсер, Скрипт обхода, запись в СУБД.

Бюджет: по договоренности
Заказчик выбрал исполнителя:
Дмитрий Лавров  
1. В СУБД есть список сайтов (главных страниц) в столбик. Нужно сделать парсер, который будет парсить <title>, <keywords> <description>, <lang>,  и <charset> этих сайтов ( главных страниц ) . Если в таблице уже будет какая то информация по этому сайту, то что бы заменял на новую (именно заменял). Если нет чего то например <charset>, то что бы игнорировал это. Потом что бы переходил по /robots.txt и доставал sitemap ссылки, если их несколько то надо брать все и записывать их в БД, только некоторые ссылки архивные с окончанием .tz или .tg их нужно записывать в отдельный столбик. Всё.
Только необходимо что бы была много поточность и какая нибудь графическая оболочка, где будет выводиться сколько в базе всего главных страниц и что бы туда можно было добавлять ссылки из этой графической оболочки txt файлом (ссылки в файле будут в столбик). И ещё нужна будет кнопка запуска и остановки этого парсинга в графической оболочке и Всё.
Опубликован 15.05.2023 в 07:09 Последнее изменение: 31.05.2023 в 02:21

Выберите способ верификации:

Обновите страницу после прохождения верификации.