Нужно написать два простых скрипта и спарсить данные:
1. открываем урлы из исходного файла, считаем на каждом количество ссылок <a>, находим среди ссылок одного урла ссылку с самым свежим datePosted, пишем в результирующий файл ее title и datePosted + исходный урл и количество ссылок
2. открываем урлы из второго исходного файла, берем первую ссылку на открытой странице, пишем в результирующий файл вместе с исходным урлом
В обоих случаях ссылок 4 тысячи штук, защиты от парсинга нет.
Могу перевести предоплату.
Опубликован 23.04.2020 в 20:45 Последнее изменение: 23.04.2020 в 22:30