Предобработка данных, EDA (исследование, поиск ключевых зависимостей)
Предлагаю услугу по подготовке и анализу табличных данных. Это первый и один из самых важных этапов в аналитике и построении моделей машинного обучения.
Что входит в услугу:
- Очистка и преобразование данных до 10 ГБ: работа с пропущенными значениями, преобразование типов, нормализация, агрегирование, группировка, приведение к единому формату и др.
- Исследовательский анализ данных (EDA): выявление ключевых закономерностей, визуальный и статистический анализ распределений, зависимостей, выбросов и аномалий.
- Построение визуализаций: графики распределений, корреляционные матрицы, диаграммы размаха, тепловые карты, временные ряды и т.д.
- Генерация выводов и наблюдений, понятных для заказчика — акцент на бизнес-понимание данных.
- По желанию — подготовка данных к обучению моделей (feature engineering, one-hot encoding и пр.).
Заказчик получит:
Файл .ipynb/.py с построненной визуализацией данных и предобработкой. По желанию все графики будут сохранены отдельно
До начала работы заказчик должен предоставить:
Данные в формате .csv, .xlsx (Excel), SQL и в других табличных форматах размером не более 10 ГБ, описание желаемой предобработки и визуализации/исследования