Автоматизированный сбор данных компаний различных отраслей с 2ГИС с высокой скоростью обработки и стабильными результатами.
Проект включал решение сложных технических задач: стабильная автоматизация браузера, извлечение полных адресов с географическими данными (район, область), обработка различных структур HTML, создание универсального алгоритма с fallback логикой.
Применение: сбор B2B баз, анализ конкурентов по регионам, мониторинг рынка, создание отраслевых справочников, геомаркетинговые исследования.
Ключевые особенности:
• Современная автоматизация браузера через Chrome Remote Debugging
• Извлечение полных адресов с географическими данными (высокая полнота)
• Универсальный алгоритм с fallback логикой для разных HTML структур
• Автоматическая пагинация по всем страницам результатов
• Система восстановления при сбоях с сохранением прогресса
• Обработка контактов: телефоны, WhatsApp, Telegram, веб-сайты
• Стабильная работа с респектабельными задержками
• Экспорт в Excel с многострочными ячейками и форматированием
Технологии: Python 3.12, pychrome, Chrome Remote Debugging Protocol, pandas, openpyxl, BeautifulSoup4, regex
Результат: готовая база данных компаний в Excel с полными контактами и адресами, готовая для использования в маркетинге и B2B продажах.