Проект выполнен как учебно-практическая реализация корпоративного хранилища данных для банковской аналитики и оценки AML-риска.
Система моделирует полный путь данных: из OLTP-слоя транзакции и клиентские данные загружаются в DWH в звёздной схеме, после чего на их основе строится аналитическая витрина dm_risk.
Реализован ETL-пайплайн на Python и SQLAlchemy: загрузка данных, маппинг суррогатных ключей, upsert-логика и перенос данных между слоями. Для проверки системы сгенерирован синтетический датасет: 100 клиентов и 200 000 транзакций, включая 1% аномальных операций.
В витрине dm_risk используются оконные функции, скользящие средние, признаки аномалий и трендов. На основе этих данных AI-агент анализирует профиль клиента, оценивает AML-риск и рекомендует, нужно ли запрашивать дополнительные документы.
Также реализованы аналитические views: помесячная динамика транзакций, отраслевой риск и топ аномальных клиентов.
Результат: полноценный прототип банковского DWH с ETL-пайплайном, витриной рисков, аналитическими представлениями и AI-агентом для AML-анализа.
Технологии: PostgreSQL, SQL, SQLAlchemy, pandas, Faker, Docker, DeepSeek API.
https://github.com/ChernyackovEugeny/Corporate_Banking_DWH