Задача: Создать программу для автоматического считывания данных с паспортов Таджикистана и Узбекистана без интернета.
Что было сделано:
Полная оффлайн-архитектура: Написал систему, которая ищет и загружает модели для распознавания текста (EasyOCR) с локального диска, не требуя подключения к сети.
Специальная обработка для паспортов:
* Конвертация PDF в изображения.
* Улучшение читаемости: увеличение резкости, коррекция контраста (CLAHE), удаление шума, автоматическое выравнивание.
* Отдельный алгоритм для MRZ-зоны: Особый режим для считывания машинной строки паспорта с использованием ограниченного набора символов (A-Z