Спарсить структуру каталога и засунуть ее в базу данных таким образом, что бы можно было проследить связь категорий, а затем вывести это на отдельном файле примерно в таком же виде.
goo.gl/jzzWef Например, это родительские категории
goo.gl/2ucEUf в главном каталоге они выглядят так и не кликабельны
take.ms/8PUwk, но в базе они должны быть помечены как родительские.
У них, соответственно, есть дочерние категории, можно посмотреть в главном каталоге или непосредственно в этой категории (
take.ms/qjiGk или
take.ms/zJ1y2) Затем нужно пройтись по каждой категории и проверить, есть ли внутри еще подкатегории, как например тут
goo.gl/j2ue56 take.ms/ZUwBM Женщинам (это якорь) Одежда (это главная родительская категория) Брюки (это дочерняя подкатегория, и она в свою очередь является одновременно родительской для категории Повседневные брюки)
Помимо того, что нужно спарсить все категории, нужно так же спарсить все ссылки быстрого доступа (
take.ms/bFFL6) и картинки категорий.
И последняя особенность нужно открыть первые 3 товара в каждой категории и сохранять прямую ссылку на товар и ссылку, ведущую на витрину продавца
take.ms/BqOhp А так же, нужно обязательно сохранять, к какой категории принадлежит товар.