[05.05.2025, 00:45:00] Дмитрий: мне надо это:
[05.05.2025, 00:45:02] Дмитрий: 📄 Техническое задание для разработчиков
🔹 Название проекта:
Нейроаватар Дмитрия — система генерации видео с синтетическим лицом и голосом на базе ИИ.
🎯 Цель проекта:
Создать систему, в которой пользователь (или админ) вводит текст → система автоматически генерирует видео, где Дмитрий (нейроаватар) озвучивает этот текст своим лицом и голосом, и получает итоговое видео через Telegram или облачную папку.
🔧 Функциональные модули и задачи
1. Входной канал (интерфейс)
Вариант A: Telegram-бот для получения текстов.
Вариант B: Google-форма, веб-форма или API-приёмник.
Поддержка только русского текста.
2. ИИ-обработка текста
Используется OpenAI GPT-4 API:
Для стилизации текста, при необходимости — доведения до нужной деловой формы.
Промт: "Отвечай от лица юриста Дмитрия, строго, по делу, на русском языке…"
Возможность отключить автокоррекцию (если текст уже финальный).
3. Синтез голоса
Используется Google Cloud Text-to-Speech или Microsoft Azure TTS:
Русский голос (Wavenet-A, Jenny, Artem и др.).
Темп, тон, паузы — соответствуют исходному примеру Дмитрия.
Аудиофайл должен быть в формате .mp3 или .wav, чистый, моно.
4. Генерация видео
Платформа: HeyGen (
www.heygen.com) с персонализированным аватаром Дмитрия.
Используется API HeyGen:
Ввод: текст + аудиофайл.
Вывод: .mp4 с озвученным Дмитрием.
Поддержка шаблона: “Motion Avatar” (если доступен).
5. Интеграция и автоматизация (через n8n)
Сценарий в n8n:
Принимает текст (из Telegram / формы / API).
Отправляет в OpenAI (если активен режим ИИ-обработки).
Передаёт в TTS (Google/Microsoft) — получает аудио.
Загружает текст + аудио в HeyGen API — получает видео.
Загружает финальное видео в Telegram-бот или Google Drive (по выбору).
6. Управление и логика
Telegram-бот должен иметь команду /generate и логировать все входящие запросы.
Весь процесс должен проходить автоматически, без ручных действий.
Возможность настроить расписание генерации (например, раз в сутки).
Возможность вручную подать текст в интерфейсе n8n (если бот не нужен).
📎 Дополнительно:
Dmitriy самостоятельно создаёт аватар в HeyGen (Motion Avatar);
Dmitriy записывает аудио и передаёт TTS-разработчику или использует Google TTS;
Все API-ключи должны быть сохранены в .env-файле, не в коде;
В системе должны быть предусмотрены защита от спама, лимит запросов, логи ошибок.
📂 Что предоставить Дмитрию после выполнения:
Рабочий Telegram-бот (если выбран этот канал);
Админ-доступ к n8n со всей логикой (или JSON-файл);
Документация: список API-ключей, инструкция по добавлению новых текстов;
Проверочное видео (пример работы на тестовом тексте);
Скрипт развёртывания (если работает через VPS).
✅ Необходимые ресурсы от Дмитрия:
Видео (2–5 мин) — для создания аватара в HeyGen;
Аудио (2–4 мин) — для обучения TTS или подтверждения тембра;
API-ключи:
OpenAI
HeyGen (получить после создания аватара)
Google Cloud или Microsoft Azure (для TTS)
Telegram (бот через BotFather, если используется)