Анализ и прогнозирование результатов спортсменов являются важными задачами спортивной науки (спортивной психологии). В краткосрочной перспективе решение этой задачи позволяет определить отбор более перспективных спортсменов и в долгосрочной перспективе оптимизировать подготовку спортсменов. Заказчиком была поставлена задача создания модели прогнозирования медалистов будущих ЧМ и определение характеристик, которые являются наиболее важными для процесса прогнозирования.
Инструменты Python Pandas Numpy Matplotlib Seaborn Scikit-Learn
Data Set : Данные содержат информацию о спортивной карьере борцов вольного и греко-римского стиля, участвовавших в чемпионатах мира 2017, 2018 г. До предобработки информация включала такие компоненты: ФИО, дату рождения, результаты международного уровня (название конкурса, дата и место). Данные результатов взяты с официального сайта «Объединенного мира борьбы» (unitedworldwrestling.org). Данные были собраны в следующем формате: ( см. на скриншоте )
DataFrame был создан для окончательного анализа и моделирования во время предварительной обработки. Каждая строка DataFrame содержит достижения конкретного спортсмена за весь период карьеры до участия в чемпионате мира ( см. скриншот)
Мы создали базовую модель прогнозирования медалистов чемпионатов мира по борьбе. Точность предсказания составила около 0,71 (0,33 - результат случайного угадывания)Точность для категории медалистов составила около 0,68 (где только около 13,4% медалистов из всех участн