ContentVault AI: Локальная система архивации, транскрибации и AI-анализа медиа

Ссылка на работу
image
Заказчику требовалась безопасная платформа для массовой загрузки, обработки и систематизации видео/аудио материалов (вебинары, лекции, подкасты, рабочие совещания). Главная задача — полностью оффлайн-транскрибация, автоматическое суммаризация контента через локальные нейросети, индексация по темам и мгновенный поиск по ключевым фразам без отправки данных в облако, что критично для соблюдения NDA и корпоративной безопасности. Решение • Разработала десктопное приложение на Python с современным GUI: drag-and-drop загрузка, очередь задач, панель прогресса и ручное управление пайплайном. • Интегрировала локальные нейросети: Whisper.cpp для высокоточной транскрибации, лёгкие LLM для суммаризации, извлечения тезисов и авто-тегирования. • Реализовала индексацию контента: полнотекстовый поиск (SQLite FTS) + векторный поиск (FAISS) для семантических запросов по смыслу. • Настроила умный поиск и навигацию: фильтрация по длительности/тегам/датам, подсветка найденных фрагментов в транскрипции, переход по таймкодам. • Обеспечила приватность и стабильность: работа без интернета, кэширование моделей, возобновление прерванных задач, экспорт в TXT/Markdown/PDF, логирование и валидация форматов.