При помощи ИИ программирования создать проксирующий сервис для работы с ИИ

Ссылка на заказ

Бюджет: по договоренности

Product Requirement Document (PRD) для сервиса Hubus

1. Executive Summary / Видение продукта:
Создать универсальный шлюз для доступа к множеству AI-моделей (LLM, мультимодальные, специализированные), объединяющий лучшие решения от разных провайдеров (Anthropic, OpenAI, Mistral и др.) в едином API, снижая сложность интеграции и оптимизируя затраты.

Цели:
- Агрегация моделей: поддержка 50+ моделей к релизу.
- Упрощение интеграции: единый API-интерфейс и SDK.
- Оптимизация стоимости: выбор моделей на основе цены/качества для реализации конкретной задачи.
- Повышение надежности: резервирование провайдеров для минимизации downtime.
- Удобный запуск: создание web интерфейса с легким переключением между моделями или одновременному обращению к нескольким моделям для тестирования наилучшего результата в ответе. (пример openrouter)
- Удобная оплата: Создание единого платёжного кабинета для пользователя при обращении к разным моделям, это пожалуй самая важная задача

Сфера применения:
- Разработчики: интеграция AI в приложения.
- Data Scientists: тестирование и сравнение моделей.
- Стартапы: доступ к SOTA-моделям без vendor lock-in.
- Корпорации: безопасное управление AI-запросами.

Риски:
- Зависимость от сторонних API (риск изменений тарифов/правил).
- Конкуренция с OpenRouter и прямыми провайдерами.
- Сложность поддержки актуальности моделей.

---

2. Product Features / Основные функции:
Унифицированный API: Совместимость с OpenAI-форматом для легкой миграции.
Поддержка 50+ моделей (текст, изображения, аудио).
Динамическая маршрутизация: Автоматический или пользовательский выбор модели под запрос (цена/скорость/качество).
Аналитика: Дашборды для мониторинга использования, затрат и производительности.
Безопасность: Шифрование данных, аутентификация через OAuth 2.0 и API-ключи.
Лимиты и квоты: Настройка лимитов запросов для пользователей/команд.
Песочница: Тестирование моделей через веб-интерфейс.
Гибкая тарификация: Pay-as-you-go и подписки с кэшбэком за выбор дешевых моделей.
Интеграции: Webhooks, Slack-уведомления, синхронизация с Azure/GCP.
Пользовательские шаблоны: Preset-промптов и workflow для частых задач.

---

3. User Stories/Use Cases – Разработчик:
"Хочу подключить GPT-5 и Claude-3 к своему приложению через один API-ключ, сравнивать стоимость запросов и автоматически выбирать оптимальную модель".

- Data Scientist:
"Нужно протестировать качество разных моделей на датасете через веб-интерфейс, не прописывая отдельные интеграции".

- Стартап-менеджер:
"Требуется снизить ежемесячные расходы на AI с $10k до $3k без потери качества ответов".

- Администратор безопасности:
"Необходимо запретить доступ к моделям с открытым исходным кодом для соблюдения compliance".

Сценарии использования:
- Реализация многоязычного чат-бота с автоматической маршрутизацией между переводачиками.
- Генерация контента с ротацией моделей для избежания rate limits провайдеров.
- Пакетная обработка данных через собственный кластер GPU с балансировкой нагрузки.

---

4. UI/UX Design Specifications
High-level требования:
- Дашборд:
– Визуализация затрат, задержек и использования моделей в реальном времени.
– Виджеты для быстрой настройки маршрутизации и лимитов.
- Model Playground:
– Интерфейс с выбором модели, полем для промпта и сравнением ответов.
– Возможность сохранять шаблоны запросов.
- API-менеджер:
– Генерация ключей, настройка IP-фильтров, история запросов.
- Дизайн-система:
– Минималистичный стиль с акцентом на функциональность.
– Темная/светлая тема, адаптивность под мобильные устройства.

---

5. Technical Requirements / Системные требования:
- Бекенд: Kubernetes-кластер с автоматическим скейлингом (AWS/GCP).
- Кэширование: Redis для частых запросов.
- Базы данных: PostgreSQL (метаданные) + TimescaleDB для аналитики.

Совместимость:
- API: REST + gRPC.
- SDK: Python, JavaScript, Go, php.
- Поддержка форматов: OpenAI-совместимые запросы, WebSocket для стриминга.

Безопасность:
- SSL/TLS для передачи данных.
- Регулярные аудиты безопасности.
- Рольная модель доступа (admin, developer, analyst).
- Логирование и аудит действий (сохранение 90 дней).

---

6. Release Criteria // Функциональность:
– Работают 20+ моделей, документированный API, базовые настройки безопасности.
- Удобство:
– Средний рейтинг юзабилити от тестировщиков ≥ 8/10.
- Надежность:
– Доступность 99.9%, обработка 1000 RPS без деградации.
- Производительность:
– Средняя задержка ≤ 800 мс для текстовых моделей.

---
7. Success Metrics / Рост:
– 10 000 активных пользователей в первый год.
– 500 млн обработок запросов/месяц к Q3 2026.
- Производительность:
– P95 latency < 1.2 сек для 95% моделей.
– Серверная доступность > 99.95%.
- Бизнес-метрики:
– LTV пользователя ≥ $300, CAC < $50.
– Партнерства с 3+ крупными провайдерами моделей.

Опубликован 04.05.2025 в 15:00

Заказ находится в архиве

Посмотреть другие заказы

Создать заказ

Выберите способ верификации:

подключить вход по Сбер ID
по Альфа ID

для клиентов Альфа-банка
верификация Самозанятого

привязка профиля на FL.ru к приложению «Мой налог» или личному кабинету плательщика НПД по номеру телефона
по скану паспорта

заполнение раздела Финансы в настройках профиля и прохождение модерации

Обновите страницу после прохождения верификации.