Необходимо разработать парсер, который будет:
Собирать комментарии из VK.com, используя API или другие доступные методы.
Собирать данные о пользователях, оставивших комментарии, включая их геопозицию (geo), возраст и другую доступную информацию.
Парсер будет использоваться для анализа активности пользователей и интеграции с нашими системами
Функциональные требования:
Авторизация в VK.com через предоставленные данные (токен, cookies или API).
Поиск комментариев по всему VK.com (публикации, посты, сообщества).
Извлечение данных о пользователях:
Имя и ID.
Геопозиция (город, страна).
Возраст (при наличии).
Сохранение всех данных в структурированном формате (JSON или CSV).
Передача собранных данных через API для интеграции.
Технические требования:
Язык разработки: Python.
Использование VK API для оптимальной работы и обхода ограничений.
Обработка больших объемов данных с учётом ограничений VK (рейтлимиты, капча).
Оптимизация производительности для работы с масштабными данными.
Дополнительно:
Предусмотреть возможность фильтрации по ключевым словам и минус-словам.
Масштабируемость решения для добавления новых функций в будущем.
На выходе:
Исходный код парсера с инструкцией по настройке и запуску.
Пример собранных данных, включая комментарии, информацию о пользователях и их атрибуты.
API-интеграция для передачи данных.
Примечание: У исполнителя должно быть понимание, как реализовать задачу технически, а не только идея, что это возможно. В случае успешного выполнения возможны аналогичные заказы для других платформ.
Опубликован 29.11.2024 в 15:26
Заказ находится в архиве