Настройка базы данных для загрузки и структурирования учебных материалов
Создать структуру базы данных для хранения учебных материалов, включая текстовые данные и видеоматериалы.
Организовать данные по дисциплинам, темам и форматам (текст или видео) для удобного поиска и доступа.
Парсинг и загрузка учебной библиотеки
Настроить скрипт для парсинга основной учебной библиотеки и загрузки данных в базу.
Структурировать данные по дисциплинам и темам для легкого поиска.
Параллельный парсинг данных из личных кабинетов
Разработать систему для одновременного парсинга данных из личных кабинетов. Парсинг должен запускаться по команде и работать параллельно.
Настроить механизм авторизации и безопасного хранения данных для доступа к личным кабинетам.
Обработка и загрузка видеоматериалов из личных кабинетов
Настроить загрузку или запись видео из личных кабинетов, если прямой доступ к скачиванию недоступен.
Преобразовать аудио в текст с помощью Speech-to-Text, при необходимости добавляя OCR для текста на экране (например, для слайдов или схем).
Разбить видео на логические части, чтобы структурировать текст и облегчить поиск по темам.
Добавление возможности ручной загрузки материалов из личной библиотеки
Настроить функционал для ручного добавления материалов из личной библиотеки.
Создать инструкцию по добавлению данных в базу, чтобы материалы легко загружались в нужные категории.
Настройка поиска по базе данных
Обеспечить возможность поиска по ключевым словам и тайм-кодам для видеоматериалов, с отображением текстовых фрагментов и привязкой к соответствующему моменту видео.
Использовать Python, SQL, Selenium/Playwright для парсинга данных, многопоточности и автоматизации.
Обеспечить безопасность данных для авторизации в личных кабинетах, настроив защиту и безопасное хранение логинов и паролей.
Разделы:
Опубликован:
28.10.2024 | 11:56 [поднят: 28.10.2024 | 11:56]
Заказ находится в архиве