Бесплатно зарегистрируйся и получай уведомления о новых проектах по работе

Поделиться:

Парсинг сайта в таблицу Excel

Заказчик
Отзывы фрилансеров: + 1 0 - 0
Зарегистрирован на сайте 3 года
Бюджет: по договоренности
1. Сайт источник  www.tlock.ru. Перед началом парсинга требуется авторизация на сайте. Для получения правильных цен закупки.
    Задача состоит собрать максимум информации с сайта в таблицу Excel, каждое свойство должно выгружаться в отдельную колонку, каждый товар  отдельная строка. В отдельные папки должны выгружаться картинки товара с сайта в формате jpg при этом должно формироваться название файла на английском языке, как вариант можно использовать название производителя-ID товара на сайте-порядковый номер фотографии, при этом название данной фотографии должно попадать с указанием расширения файла в отдельную колонку таблицы свойств данного товара. Под каждую фото должно быть отдельная колонка. Таблица должна иметь структуру левого меню сайта и его подразделов. Можно сделать отдельные свойства, которые будет соответствовать  разделу сайта по левому меню, Автоматические пороги, Броненакладки и пластины и т.д.
2.  Собираемая информация:
2.1  Название раздела: Автоматические пороги, Броненакладки и пластины и т.д.
2.2  подраздел соответствующего раздела, пример  (www.tlock.ru/catalog/ruch...
2.3  Из открываемой карточки товаров должно сохраняться:
Пример: www.tlock.ru/catalog/ruch...
Подраздел раздела (www.tlock.ru/catalog/ruch...
Название товара
ID товара
Производитель
Страна
Вес
Цена 2 вида (1- после регистрации на сайте, так как цена у каждого пользователя после регистрации своя, 2 – цены до регистрации, минимальная цена другого поставщика)
Единица измерения
Сертификат (при наличии) + сохранять сертификат в отдельную папку с уникальным названием на английском.
Фото товара (первое фото головное, затем в каждой отдельной колонке последующие фото при наличии.
Урл страницы
Рекомендованные товары (каждый товар в отдельной колонке, сохраняем название товара, цену, в идеале и ID товара  каждое свойство отдельная колонка.)
Описание товара ( возможность  рерайтить онлайн уникальность описания от 96%.???)
Признак Распродажа, Новинка и т.д., пример: www.tlock.ru/catalog/ruch...
2.4.  Закладка Технические характеристики
Все данные, которые имеются на данной закладке (предусмотреть убрать задвоенности из карточки товара из пп. 2,3)
2.5 Закладка Видео
Видео сохранить в отдельную папку, с созданием уникального названия видео на английском, с указанием расширения. Название с раширением прописываем в отдельную колонку свойств.
2.6  Закладка Аналоги
каждый товар в отдельной колонке, сохраняем название товара, цену, в идеале и ID товара  каждое свойство отдельная колонка
3. Парсер должен иметь функцию анализа 
Товар который ушел с сайта (есть у нас  нет на сайте поставщика)
Товар который добавился, новый (нет у нас  есть на сайте поставщика)
Изменения в данных у товаров (надо понять как их можно выделить, цветом например.. это нужно для того, чтобы иметь возможность отслеживать добавление новой информации, например появился новый товар, а описание по нему появилось спустя месяц, или поменялся скажем какой то параметр в свойстве товара, должна возможность это отследить и т.д.)

В откликах хотелось бы увидеть: 
Опыт работы 
Cтоимость часа работы / стоимость реализации
Дату возможного начала работы 
Сроки работы



Разделы:
Опубликован:
15.09.2018 | 00:32

Теги: Веб программисты удаленно, нужен программист, резюме программиста, требуется программист, резюме веб программиста