Заказчику требовалась безопасная платформа для массовой загрузки, обработки и систематизации видео/аудио материалов (вебинары, лекции, подкасты, рабочие совещания). Главная задача — полностью оффлайн-транскрибация, автоматическое суммаризация контента через локальные нейросети, индексация по темам и мгновенный поиск по ключевым фразам без отправки данных в облако, что критично для соблюдения NDA и корпоративной безопасности.
Решение
• Разработала десктопное приложение на Python с современным GUI: drag-and-drop загрузка, очередь задач, панель прогресса и ручное управление пайплайном.
• Интегрировала локальные нейросети: Whisper.cpp для высокоточной транскрибации, лёгкие LLM для суммаризации, извлечения тезисов и авто-тегирования.
• Реализовала индексацию контента: полнотекстовый поиск (SQLite FTS) + векторный поиск (FAISS) для семантических запросов по смыслу.
• Настроила умный поиск и навигацию: фильтрация по длительности/тегам/датам, подсветка найденных фрагментов в транскрипции, переход по таймкодам.
• Обеспечила приватность и стабильность: работа без интернета, кэширование моделей, возобновление прерванных задач, экспорт в TXT/Markdown/PDF, логирование и валидация форматов.