Простая классификация текста с учителем (python/scikit)

Бюджет: по договоренности
Заказчик выбрал исполнителя:
Ильдар Бакиров  
Нужно реализовать классификатор текста на питоне. 

Есть обучающая выборка ~ 3 000 строк размеченных данных, формата: 
Столбец 1 – текст от 0 до 250 символов 
Столбец 2 – класс для текста (классов может быть до 40)

Нужно написать код (с комментариями), который будет обучатся на обучающей выборке и сможет применятся к произвольным данным. 
Тестировать код на «боевых данных» и работать с на повышение качества не придётся. 

Должно использовать минимум 2 алгоритма, на ваш выбор желательно простые и эффективные. И эмбединг (word2vec).

На вход будет поступать:
1) file1.xlsx – обучающая выборка (2 столбца) 
2) fiile2.xlsx – неклассифицированные данные (1 столбец с текстом) 

На выход: 
1) file2_algorithm1.xlsx
2) file2_algorithm2.xlsx

Результат вашей работы – это читаемый код с понятными комментариями.
Опубликован 15.12.2021 в 23:28

Выберите способ верификации:

Обновите страницу после прохождения верификации.