Создать программу анализа данных (сами данные будут предоставлены по запросу) согласно ниже написанному заданию на языке R/Matlab.
Срок до 20 апреля.
Задание:
1) с помощью метода главных компонент определить основные факторы(компоненты), объясняющие вариацию в данных;
2) определить профили данных, соответствующие экстремальным значениям осей первых трех главных компонент;
3) на основе полученных профилей данных сформировать кластеры данных, используя линейный коэффициент корреляции. Связать полученные кластеры с искомыми группами пациентов.
3) решить эту же задачу с помощью неиерархического метода кластерного анализа (k-средних).
4) сравнить результаты, полученные методом главных компонент и неиерархическим кластерным анализом.
5) Сделать выводы (прокомментировать найденные группы пациентов, эффективность химиопрепаратов, сравнить результаты работы двух подходов к анализу данных).
1) Разработка алгоритмов интеллектуального анализа данных. Разработка, реализация и отладка:
• метода главных компонент;
• неиерархического алгоритма кластерного анализа (k-средних);
• критериев качества кластерного анализа.
2) Анализ экспериментальных данных
- Анализ экспериментальных данных. Цель анализа – распределить пациентов по группам в зависимости от их чувствительности к химиопрепаратам, сравнить реализованные методы анализа, проверить устойчивость работы алгоритмов, компактность полученных кластеров, статистическую близость профилей пациентов внутри кластеров.
Более развернутое описание самой курсовой будет предоставлено по запросу.
Опубликован 28.03.2016 в 12:46