Мультимодальный чат-бот в Telegram: Портфолио фрилансера Илья Прудников 10.12.2023, работа №3

Описание проекта: Серийный предприниматель обратил внимание на область искусственного интеллекта, стремясь предложить уникальное на рынке решение. Проект включал разработку логики для LLM, генераторов txt2img, txt2voice, методов voice2text, оптического распознавания символов (OCR) и компьютерного зрения (CV). В проекте участвовало 5 специалистов, включая разработчиков и дизайнеров UI/UX, с постоянным сотрудничеством с 2-3 разработчиками со стороны клиента для определенных задач. Технологический стек: - Python - LLM Стек ИИ: - faceswap - txt2image - txt2video - lipsync - txt2voice - voice2txt Функциональность: - Создание анимированного контента с разнообразными опциями настройки - Пользовательский контент с синхронизацией губ и эффектами масштабирования - Изучение языков на основе GPT, включая madlibs и взаимодействие с пользователем - Assistant Pro для голосовых ответов, распознавания изображений и рисования Результаты: Проект предоставил функционального Telegram-бота, который безупречно интегрировал ИИ-сервисы, предлагая инновационный и персонализированный опыт изучения языков. Были реализованы оптимизации системы для улучшения производительности и совместимости.