Бюджет:
1200 руб
Добрый день.
Нужен скрипт (желательно на python).
Задача:
Мониторинг и парсинг постов Facebook пабликов 100+ шт.
На входе sql таблица со списком facebook пабликов:
id (INT)
public_link (TEXT) линк на фб паблик
last_parse_datetime (datetime) дата последнего опубликованного поста
Результат записывается в другую таблицу:
id (INT)
public_link (TEXT) линк на фб паблик
post_datetime (datetime) дата, время поста (желательно в timestamp)
post_text (TEXT) полный текст публикации
post_image_preview (TEXT) линк на изображение поста (линки на видео не надо)
post_likes (INT) к-во лайков
post_parse_datetime (datetime) дата парсинга
post_moderated (INT) ноль
Алгоритм:
1) Из входной таблицы берем ссылку и дату последнего сохраненного поста;
2) Переходим по ссылке и заполняем вторую таблицу данными, полученных с постов после указанной даты последнего поста (last_parse_datetime)
Для предотвращения блокировок со стороны Facebook должна быть возможность использовать прокси (чтение из *.txt файла).
При возникновении блокировки, использовать следующие по списку прокси.
Скрипт должен работать на облачном сервере и запускаться по расписанию (Возможно через cron).
Так же прошу описать подробную инструкцию по запуску и сопровождению скрипта.