Требуется парсинг сайта (скорее всего вручную).
Пример страницы:
Это страница изделия.
На странице изделия слева находится список модификаций изделия ("5D4C1H Promag D 400, 5D4C1H, DN100 4" и т.д.). В данном случае их 6. Для всех товаров это число различно, есть изделия без модификаций, в таком случае это меню отсутствует.
В центральном окне находится список параметров изделия.
Для каждой из модификаций нужно:
1) Раскрыть весь список параметров с помощью кнопки [+] на серой полоске над списком.
2) Скопировать весь список начиная от названия (в данном случае "Promag...") и заканчивая последней строкой списка (в данном случае "...Сетевой адрес шины, см. доп. специфик.").
3) Вставить скопированное в OpenOffice (потому что в Excel криво копируется). Все вставляется в один файл, сразу же за предыдущей вставкой, без какого-либо дополнительного форматирования.
4) В данном примере в разделе "Кабель для разнесенного исполнения:" есть дополнительные поля для ввода значений. По умолчанию в них указано значение "-1,00". Если поместить курсор в это поле, появляется информационное окно, в котором указаны допустимые значения (например от 1 до 200). Эти значения также надо занести в таблицу.
Всего нужно обработать 393 такие страницы. У разных изделий разное количество модификаций. Всего модификаций по всем изделиям должно получиться 1055. Полученный файл должен быть сохранен в формате Excel (xlsx).
Дополнительная информация.
1) Адрес ссылки на все изделия одинаковы, отличаются лишь последним значением "ordercode=5D4C". Например, для другого изделия будет та же самая ссылка, но с "ordercode=PMD55".
2) Исходные данные список страниц или номеров изделий можем предоставить в любом виде, формате и т.п., как вам будет удобно. Можем сделать веб-страницу, содержащую ссылки на данные страницы (но модификации в любом случае нужно будет выбирать вручную).
Хотелось бы услышать от вас предложения по стоимости выполнения данной работы.
Спасибо.