🔧 Техническое задание:
Настройка парсера занятых дат из календаря на сайте
🎯 Цель проекта:
Нам необходимо автоматически извлекать занятые даты из онлайн-календаря бронирования (виджет RealtyCalendar), отображаемого на сайте глэмпинга kedr.camp, и сохранять эти даты в таблицу (Google Sheets, Excel или CSV) в структурированном виде.
В будущем эти данные будут использоваться для:
Автоматической генерации визуальных календарей занятости,
Автопостинга в соцсети (VK, Telegram),
Информирования клиентов о свободных датах.
📍 Источник данных:
Страница:
Сайт: работает на Тильде, календарь подгружается как JS-виджет с сайта realtycalendar.ru, поэтому требуется инструмент, способный взаимодействовать с динамическим контентом (например, Octoparse, Apify, Playwright, Selenium).
🧠 Что нужно сделать:
1. Настроить инструмент парсинга
Выбрать подходящий инструмент (Octoparse или аналогичный с поддержкой JavaScript-рендеринга).
Настроить автоматическое открытие страницы:
Убедиться, что страница загружается полностью, включая календарь.
2. Извлечь ТОЛЬКО занятые даты
Выделить ячейки календаря, у которых есть CSS-классы .event.all, .event.begin или .event.end.
Это ЗАНЯТЫЕ дни. Свободные даты пропускаем.
Извлекать нужно только числовое значение даты (например, 3, 4, 5 и т.д.).
3. Добавить контекст месяца
Автоматически извлекать текущий месяц и год, отображаемые над календарём (например, Март 2025).
Привязывать его к каждой извлечённой дате.
4. Собрать таблицу следующего формата:
day month_year
1 Март 2025
2 Март 2025
3 Март 2025
5. Настроить регулярный экспорт (опционально)
Экспортировать в:
Google Sheets (предпочтительно), или
CSV / Excel файл
Автоматизировать обновление данных 1 раз в сутки (если возможно).
🔄 Дополнительно (опционально):
Настроить переход на следующий месяц (клик по стрелке “вперёд”) и сбор данных по нескольким месяцам вперёд (если реализуемо).
Подготовить инструкцию для нас — как запускать, изменять и экспортировать парсинг вручную при необходимости.