Автоматизация перевода сканов документов (API: OCR → Перевод → PDF)

Ссылка на заказ

Бюджет: по договоренности

Контекст / Проблема:

Наша компания собирает юридические досье. Часть досье – это перевод на английский документов от брокеров, которые клиенты присылают в виде сканов (не электронный PDF). Документы могут иметь сложную структуру с таблицами и финальный перевод должен сохранять исходную структуру. В случае с нативными PDF – нам помогает просто google translate, но в случае со сканами требуется сделать OCR (например, через chatgpt) или другой продукт, потому восставновить layout. А люди не технические. Им нужно одно окно для получения перевода.

Задача:

Создать базовое веб-приложение для автоматизированного перевода отсканированных документов с сохранением лэйаута, которое позволит:

- загружать PDF / JPEG / PNG-файлы (сканы, фото);
- автоматически распознавать текст (OCR) с восстановлением таблиц и стилей (через интеграцию c системами на рынке)
- автоматически переводить текст с русского на английский
- собирать переведённый текст обратно в исходный формат (DOCX / PDF), сохраняя таблицы и оформление;
- скачивать результат, готовый к подаче в госорганы.

В качестве решения chatgpt предложил решение:

- интеграция: ABBYY Cloud OCR SDK — OCR и восстановление таблиц → DOCX
- интеграция: DeepL API или Google Cloud Translation — перевод DOCX с сохранением форматирования

В качестве хранилища: в идеале на первом этапе использовать просто google drive. Или вообще все пока оставлят на фронте без сохранения

Опубликован 17.09.2025 в 16:10 Последнее изменение: 17.09.2025 в 16:14

Заказ находится в архиве

Посмотреть другие заказы

Создать заказ

Выберите способ верификации:

подключить вход по Сбер ID
по Альфа ID

для клиентов Альфа-банка
верификация Самозанятого

привязка профиля на FL.ru к приложению «Мой налог» или личному кабинету плательщика НПД по номеру телефона
по скану паспорта

заполнение раздела Финансы в настройках профиля и прохождение модерации

Обновите страницу после прохождения верификации.