Работа №2
тема: посещение мероприятий
Цель задания
Познакомиться с базовыми принципами работы машинного обучения на примере:
анализа текстовых данных,
обучения простой модели,
интерпретации результатов,
понимания ограничений ИИ.
Все шаги выполняются в Google Colab.
Вам необходимо создать небольшую модель согласно варианту, которая:
получает текст,
определяет его эмоциональную окраску,
и умеет честно сказать «я не уверен», если данных недостаточно.
Создание датасета
15–30 коротких текстов
каждый текст относится к одному из трёх классов:
positive — позитивный
neutral — нейтральный
negative — негативный
Примеры:
«Занятие было интересным» → positive
«Сегодня была пара» → neutral
«Лекция была очень скучной» → negative
Тексты должны быть:
осмысленными,
не одинаковыми,
написанными человеческим языком, а не шаблонами.
2. Обучение модели
Используя готовый шаблон ноутбука:
преобразовать тексты в числовой вид (векторизация),
обучить модель классификации,
проверить её работу на примерах.
3. Проверка модели на новых фразах
Проверьте модель:
на фразах из датасета,
на новых фразах, которых модель раньше не видела.
Обратите внимание:
где модель ошибается,
где она не уверена в ответе.
4. Визуализация (графики)
Постройте графики:
распределение текстов по классам,
уверенность модели (вероятности),
при желании — сравнение предсказаний.
5. Порог уверенности
В модели должен быть реализован порог уверенности:
если уверенность ниже заданного значения (например, 0.75),
модель должна отвечать: «Я не уверен в определении тональности»
Опубликован 17.03.2026 в 15:19