1. Цель проекта:
Создать программу для автоматической обработки архивов с документацией или просто файловая загрузка. Программа должна извлекать текстовые данные из документов, сопоставлять их с эталонными данными из справочников, формировать опись и сохранять результат в определенном формате (шаблоне Word, .doc). Также переименовать загруженные файлы и нанести номер документа на сам файл.
2. Основные функциональные требования:
Обработка архивов:
Программа должна поддерживать работу с архивами форматов: .zip, .rar, .7z.
Извлекать содержимое архива в указанную директорию с проверкой на успешность распаковки.
Извлечение текста из документов:
Поддерживаемые форматы файлов: .pdf, .docx, .xlsx, .txt.
Извлечение текста из PDF-документов, включая распознавание текста с изображений с помощью OCR (при необходимости).
Извлечение данных из документов MS Word и Excel с возможностью обработки табличных данных.
Сопоставление данных:
Сопоставление извлеченных данных с данными из справочника обозначений документов.
Использовать справочники, загруженные пользователем (например, справочник обозначений).
Формирование описи:
Формировать опись по заданной структуре.
Данные в описи должны заполняться автоматически на основе извлеченных и сопоставленных данных, включая наименование документа, обозначение, количество листов и формат.
Переименование: загруженные файлы нужно переименовать по определенному алгоритму.
Нанесение: на каждый файл нужно нанести определенный номер в углу. Номера будут загружаться в exel файле отдельно.
Разделы:
Опубликован:
28.10.2024 | 11:40
Заказ находится в архиве