Есть список артикулов (Данные для ввода). Нужно автоматически найти каждый артикул на сайте tstarter.ru, открыть карточку товара и выгрузить:
характеристики товара (напряжение, мощность, размеры и т.д.)
все кросс-номера (замены) + бренд каждого кросса
сложить это в Excel в нужных колонках
2) Входные данные (что даю программе)
Excel / CSV / текст со списком артикулов (один артикул = одна строка).
Пример ваших входных данных (как есть):
TT90248
EX4531009100
IB131002
4820-022
TT61965
Важно:
Артикулы могут быть разных форматов (TT…, EX…, IB…, DV…, 4820-…, 4800-…, и т.д.)
Программа должна уметь искать любой артикул по сайту.
3) Источник данных (где берём)
Сайт: tstarter.ru
Нас интересуют карточки товаров (страницы вида):
и другие разделы, если артикул не стартер/генератор (программа должна поддержать тоже).
4) Как программа должна находить нужную страницу товара
Для каждого артикула из списка:
Сделать поиск “по номеру” на сайте (как делает человек в поиске на сайте)
В результатах выбрать точное совпадение по артикулу
Открыть найденную карточку товара и взять данные
Если артикул не найден:
записать его в отдельный лист/файл “Ошибки”: Артикул + причина (“не найден”, “несколько совпадений”, “страница недоступна”)
Если найдено несколько совпадений:
либо брать первое точное совпадение,
либо выносить в “Ошибки” как “несколько вариантов” (как решите, но важно чтобы это было зафиксировано).
5) Что именно вытаскиваем из карточки товара
5.1. Общие поля товара
Из карточки берем:
Ссылка на страницу (URL) — это будет колонка “ССЫЛКА (ДЛЯ СПРАВКИ)”
Артикул (главный артикул товара)
Наименование (например “Генератор”, “Стартер”, либо полное название из заголовка карточки)
Исполнение (DENSO / BOSCH / DELCO / MITSUBISHI и т.д.)
Тип транспортного средства (Automotive / Agricultural & Industrial / Van / …)
5.2. Характеристики (пары “название характеристики” → “значение”)
На странице они обычно идут списком/таблицей: “Напряжение — 12 V”, “Мощность — 1.4 KW”, и т.д.
Нужно заполнить ваши колонки (если на странице поля нет — оставить пусто):
Колонки :
ССЫЛКА (ДЛЯ СПРАВКИ)
Артикул
Наименование
Напряжение
Мощность
Сила тока
Размер A
Размер B
B+ диаметр
D+
Размер C
Размер D
Количество зубьев
Диаметр зубчатки
Длина
Направление вращения
Клемма
Подключение
Протокол обмена
Код:
Тип шкива
Шкив диаметр
Количество ручьёв
Исполнение
Тип транспортного средства
Ширина упаковки
Высота упаковки
Глубина упаковки
Масса
Кросс-номер
Бренд
Единицы измерения сохраняем как на сайте (пример: “12 V”, “95 mm”, “6.06 kg”, “0.192 m”).
6) Кроссы: как выгружаем (самое важное)
В карточке есть блок типа “Кросс-номера и комплектующие”.
Там обычно список строк вида:
TT12242 — TT
104210-1860 — DENSO
27060-30060 — TOYOTA
и иногда рядом встречается слово “Комплектующие” — его не пишем в итог (оно не нужно).
Правило формирования строк результата
На один товар делаем много строк:
одна строка = один кросс-номер + его бренд
все остальные характеристики товара в этой строке повторяются
То есть если у товара 50 кроссов → будет 50 строк в Excel.
Дубликаты
Если на странице один и тот же кросс повторяется — в итоговом Excel:
убрать дубли (уникальность по паре Кросс-номер + Бренд)
7) Формат результата (что отдаёт программа)
7.1. Основной файл
Excel (.xlsx), лист “DATA”, колонки строго как в п.5.2.
7.2. Лист/файл ошибок (обязательно)
Лист “ERRORS” (или отдельный файл), колонки:
Артикул_входной
Статус (не найден / несколько совпадений / ошибка загрузки)
Комментарий (что случилось)
Дата/время
8) Технические требования (простыми словами)
Не “долбить” сайт: делать паузу между запросами (например 0.5–1 сек)
Обрабатывать 100–5000 артикулов за запуск
Если сайт временно не отвечает — повторить попытку 2–3 раза и записать ошибку
Вся выгрузка в UTF-8, чтобы 1С нормально приняла
9) Пример результата (как у вас)
На выходе должно получаться как в вашем примере: одна и та же карточка товара, но много строк — по числу кроссов.
10) Ваш текущий список артикулов
Этот список (TT90248…TT61965) — это входной файл для первого тестового прогона.