Гарантия возврата
Вернем деньги, если что-то пойдет не так.
Артур Крецу
Артур
Верифицированный пользователь
Чат откроется после оплаты
Стоимость услуги
5 070 rub

Срок выполнения

3 дня

Гарантия возврата
Вернем деньги, если что-то пойдет не так.
Артур Крецу
Артур
Верифицированный пользователь

Очистка, merge и дедупликация CSV/JSON данных

Соберу pipeline очистки и объединения для 3 входных CSV/JSON файлов в один итоговый датасет. Базовый пакет рассчитан на нормализацию до 12 полей и дедупликацию по 2 ключам без отдельной BI-панели. Что входит в базовую стоимость: - Очистка и merge до 3 входных CSV/JSON файлов в 1 итоговый датасет. - Нормализация до 12 полей: даты, телефоны, email, статусы и другие согласованные колонки. - Дедупликация по 2 ключам, например email + phone или external_id + date. - Отдельный лог дубликатов и строк, которые не прошли очистку. - Итоговая выгрузка в CSV или JSON + README по запуску pipeline. Что не входит в базовую стоимость: - Онлайн-дашборд, web-интерфейс и постоянная синхронизация источников в реальном времени. - Обработка десятков файлов и сложная многослойная бизнес-логика в одном базовом пакете. - Миграция данных между несколькими боевыми системами и CRM. Как проходит работа: - Согласуем 3 входных файла, 12 полей нормализации и 2 ключа дедупликации. - Собираю pipeline, тестирую merge и показываю лог дубликатов на контрольной выборке. - Передаю скрипт, итоговый CSV/JSON и инструкцию по повторному запуску. Что получает заказчик в итоге: Команда получает один чистый датасет без дублей и ручного merge нескольких CSV/JSON файлов. Финальная передача: - Pipeline очистки, merge и дедупликации для 3 CSV/JSON файлов. - Итоговый CSV/JSON датасет и лог дубликатов/ошибок очистки. - README с настройкой полей, ключей и повторного запуска.

Заказчик получит:

Один CSV/JSON после merge 3 файлов и дедупликации по 2 ключам.

До начала работы заказчик должен предоставить:

Что нужно от заказчика: - До 3 примеров CSV/JSON файлов с реальной структурой колонок. - Список до 12 полей, которые нужно нормализовать на выходе. - 2 ключа дедупликации и правила, по которым выбирается победившая запись.
Очистка, merge и дедупликация CSV/JSON данныхОчистка, merge и дедупликация CSV/JSON данных