Цель проекта
Разработать программу для автоматизированного поиска и фильтрации целевой аудитории (ЦА) на основе загруженной базы данных (номеров телефонов) через возможности рекламного кабинета ВКонтакте. Программа должна выявлять наиболее релевантную аудиторию по заданным интересам (например, "Автолюбители") и параметрам через систематический перебор и анализ сегментов.
Ниже будет описан метод, в качестве примера, который я вижу для реализации этой цели. Однако, вы можете предложить свой способ перебора для фильтрации.
Описание работы программы
Фаза 1: Исходная обработка данных
Загрузить файл с номерами телефонов (например, 120 млн записей).
Разбить данные на сегменты:
Размер сегмента: 500 номеров (для примера)
Перемешать номера в случайном порядке для устранения систематической ошибки.
Подготовить сегменты для последовательной загрузки в рекламный кабинет.
Цель: Подготовить данные для загрузки и анализа, исключить упорядоченность номеров.
Фаза 2: Загрузка сегментов и первичная фильтрация
Подключиться к рекламному кабинету ВКонтакте через API:
Поддержка авторизации через несколько аккаунтов (например, 3 аккаунта).
Установить паузы между запросами для обхода лимитов (например, 1 запрос каждые 0.33 секунды).
Последовательно загружать сегменты в рекламный кабинет:
Каждый сегмент отправляется на проверку (загрузка 500 номеров за запрос).
Для каждого загруженного сегмента фиксировать число пользователей, соответствующих параметру "Активная аудитория ВКонтакте".
Применить настройку интересов (например, "Автолюбители") и получить данные:
Число пользователей, соответствующих интересу (например, 30% или 27%).
Записать процент релевантной аудитории для каждого сегмента. (Это пример, можете предложить свой способ фильтрации).
Цель: Оценить каждый сегмент на соответствие заданному параметру и получить первичные данные для анализа.
Фаза 3: Повторные этапы фильтрации
После первичного анализа перемешать все номера телефонов заново.
Разделить базу на новые сегменты (по 500 номеров) и повторить процесс:
Загрузка сегмента.
Проверка на соответствие интересу.
Фиксация процента релевантности.
Повторить процедуру 100 раз (или оптимизированное число раз) для повышения точности.
Цель: Постепенно сузить базу, чтобы выявить номера с высокой вероятностью принадлежности к ЦА.
Фаза 4: Итоговый анализ
Обработать данные по каждому номеру:
Вычислить совокупный "рейтинг" номера (средний процент релевантности по всем этапам).
Составить финальную базу:
Номера с наивысшим рейтингом (например, выше 85%).
Экспортировать результат в формате .csv.
Цель: Получить отфильтрованную целевую аудиторию с высокой точностью.
Основные функции программы
Работа с файлами:
Загрузка базы номеров.
Разбиение на сегменты заданного размера.
Перемешивание данных.
Интеграция с API ВКонтакте:
Авторизация через несколько аккаунтов.
Загрузка сегментов в рекламный кабинет.
Получение статистики по интересам и другим параметрам.
Анализ сегментов:
Фиксация процентов релевантной аудитории.
Постепенное уточнение ЦА через многократные итерации.
Вывод результатов:
Генерация отчётов по сегментам (релевантность).
Экспорт финальной базы релевантных номеров.
Технические требования
Язык программирования:
Допустим, Python, но это не принципиально. Главное ваш опыт работы с vk_api.
Обработка данных:
Эффективная работа с большими объёмами данных (до 120 млн номеров).
Использование многопоточности для ускорения.
Логирование:
Ведение логов загрузки, ошибок и статистики.
Производительность:
Скрипт должен корректно работать в течение длительного времени (предполагаю, время работы может занимать до нескольких дней).
Параллельная обработка запросов для 3 или более аккаунтов.
Просьба откликаться только исполнителям с опытом API VK
В отклике, пожалуйста, сразу пишите срок к какому числу готовы разработать и протестировать. Срок имеет ключевое значение.
Спасибо за прочтение!
Разделы:
Опубликован:
17.01.2025 | 11:53 [последние изменения: 17.01.2025 | 11:55]
Заказ находится в архиве