Скрапинг сайта (Python 2.7, Scrapy)

Ссылка на заказ

Бюджет: 3 000

41.72 $ – 36.16 €

Заказчик выбрал исполнителя:

Михаил Синегубов

Необходимо написать скрипт на Python 2.7 с использованием библиотеки scrapy, который будет выполнять скрапинг страниц на сайте chelyabinsk.flamp.ru и сохранять отзывы в файлах формата json. Например, сохранять в файле все отзывы со страницы chelyabinsk.flamp.ru/firm... после нажатия кнопки «Показать ещё отзывы» и после прокрутки этой страницы до конца.

Если открыть эту страницу в Гугл Хром и открыть инструменты разработчика, видим (см файл «flamp1.png»), что при нажатии на кнопку «Показать ещё отзывы» выполняется запрос «reviews?limit=5», далее после страницы прокрутки мышью выполняется запрос «reviews?limit=5&offset_id=3273977», далее при прокрутке мышью – запрос «reviews?limit=5&offset_id=2868699» и т.д. Причём в данных, которые возвращает предыдущий запрос, есть ссылка на следующий запрос, например, запрос «reviews?limit=5» возвращает ссылку на запрос «reviews?limit=5&offset_id=3273977»:

"next_link":flamp.ru/api/2.0/filials/...

Данные поступают в формате json, например, текст отзыва – это значение поля “text” (см файл «flamp2.png»). Необходимо сохранить в файле json данные о всех отзывов с указанной страницы. Например, на странице «chelyabinsk.flamp.ru/firm... есть 27 отзывов на момент 23.08.18. Пусть в файл сохраняются следующие поля: "next_link", "filial_id", "user_id", "text", "rating", "date_created", "source", "user":{"name"}, "official_answer"

Работа с библиотекой Scrapy описана здесь:

docs.scrapy.org/en/latest...

Решение такой же задачи описано здесь:

habr.com/post/312816/

Будем считать, что задание выполнено, если Вы отправляете мне скрипты Scrapy, которые успешно выполняются на моём компьютере (на Python 2.7)

Опубликован 23.08.2018 в 21:22

Посмотреть другие заказы

Создать заказ

Выберите способ верификации:

подключить вход по Сбер ID
по Альфа ID

для клиентов Альфа-банка
верификация Самозанятого

привязка профиля на FL.ru к приложению «Мой налог» или личному кабинету плательщика НПД по номеру телефона
по скану паспорта

заполнение раздела Финансы в настройках профиля и прохождение модерации

Обновите страницу после прохождения верификации.

Скрапинг сайта (Python 2.7, Scrapy)

Выберите способ верификации:

Теги: нужен программист, резюме программиста, требуется программист, резюме веб программиста