Оффлайн-система распознавания иностранных паспортов

Ссылка на работу
Задача: Создать программу для автоматического считывания данных с паспортов Таджикистана и Узбекистана без интернета. Что было сделано: Полная оффлайн-архитектура: Написал систему, которая ищет и загружает модели для распознавания текста (EasyOCR) с локального диска, не требуя подключения к сети. Специальная обработка для паспортов: * Конвертация PDF в изображения. * Улучшение читаемости: увеличение резкости, коррекция контраста (CLAHE), удаление шума, автоматическое выравнивание. * Отдельный алгоритм для MRZ-зоны: Особый режим для считывания машинной строки паспорта с использованием ограниченного набора символов (A-Z