1. Цель проекта
Создать автоматизированную систему, которая:
Находит и заменяет изображения на 4 сайтах (общее количество ≈2000).
Подбирает тематически близкие аналоги ( с Freepik).
Сохраняет SEO-атрибуты (alt, title, имя файла).
Работает без постоянного ручного вмешательства.
2. Требования к решению
Бюджетный вариант (Python + API + автоматизация):
Парсинг текущих изображений
Сбор всех <img> с указанных сайтов (через BeautifulSoup/Selenium).
Извлечение метаданных (alt, title, окружающий текст).
Поиск замены через API
Интеграция с Freepik API (или аналогами: Unsplash, Pexels).
Фильтрация по бесплатным изображениям (с учетом лицензии).
Семантический подбор (опционально)
Использование CLIP (OpenAI) или ResNet для сравнения эмбеддингов.
Если ИИ не входит в бюджет — подбор по ключевым словам из alt/title.
Загрузка и замена
Автоматическая замена URL (если изображения хранятся на внешних CDN).
Либо загрузка новых файлов через FTP/WP-CLI (если сайты на WordPress).
Логирование и безопасность
Лог изменений (какие картинки заменены, исходные/новые URL).
Проверка на 404 ошибки после замены.
3. Технические детали
Язык: Python (предпочтительно) или PHP (если сайты на WP).
Библиотеки:
requests, BeautifulSoup/Selenium — для парсинга.
Pillow, clip — для анализа изображений (если нужно).
Freepik API/Unsplash API — для поиска замены.
Хостинг: Скрипт может работать на VPS или локально (если сайты позволяют удалённое управление).
Сайты на БУСе и на moodle
Разделы:
Опубликован:
25.04.2025 | 14:57 [поднят: 25.04.2025 | 14:57]
Заказ находится в архиве