Умный Telegram-бот с GPT-4o, генерацией изображений через Gemini, анализом фото и базой знаний (RAG)
✨ Возможности
🧠 Интеллектуальный диалог
GPT-4o для естественного общения
GPT-4o-mini для быстрых ответов
Контекстная память разговора
Поддержка различных режимов работы
🎨 Генерация изображений
Google Gemini 2.5 Flash Image для создания изображений
Автоматическое распознавание запросов на генерацию
Быстрая генерация через OpenRouter
🎤 Голосовые возможности
Whisper для распознавания речи
TTS для озвучивания ответов
6 различных голосов на выбор
Полноценный голосовой режим
👁️ Анализ изображений
GPT-4o Vision для понимания картинок
Детальное описание содержимого
Ответы на вопросы по изображениям
Анализ документов и схем
📚 База знаний (RAG)
Загрузка собственных документов
Поиск по содержимому файлов
ChromaDB для векторного поиска
Поддержка PDF, TXT, MD форматов
https://github.com/Jeff555max/Multi-Tool-Assistant