Привет! Необходимо запустить инструменты Unstructured или Docling для распознавания документов (нормативных актов) и возвращать содержимое документов в текстовом формате. Требуется автоматизированное извлечение текста. Документы могут быть в разных форматах: doc, docx, pdf, jpg, png, csv, odt, и т.д. Желательны навыки работы с OCR, AI, распознаванием документов. Большинство файлов до 10 мб, но есть отдельные файлы по 200+ мб. (например в pdf документах бывают очень тяжелые изображения).
Разделы:
Опубликован:
12.12.2025 | 09:37 [поднят: 12.12.2025 | 09:37]