Парсинг данных с источника
Поиск осуществляется по Информации о залогодателе:
- ФИЗИЧЕСКИХ ЛИЦ по ФИО (ФИ) + Дата рождения
- ЮРИДИЧЕСКИХ ЛИЦ по ИНН/ОГРН организации
В ответе на вкладке «Нотариальная палата» содержится Номер уведомления о возникновении залога. При клике на Номер открывается PDF-файл с таблицей. Необходимо осуществить парсинг всех сведений из этого документа.
Организовать обход капчи на базе ИИ без использования сторонних сервисов. Требуемый процент успешного «разгадывания» – не менее 95%. В случае неудачного «разгадывания» программно активировать кнопку обновления капчи.
Обеспечить стабильность работы приложения с учетом политики безопасности источника. Исключить идентификацию приложения источником как автоматизированной системы (использование proxy).
Обрабатывать следующие ошибки и передавать с уникальными кодами:
1. Источник недоступен
2. Ошибка ввода капчи
3. Ошибка ответа от источника
4. Доступ запрещен (пользователь идентифицирован как автоматическая система)
5. Доступ для текущего IP-адреса заблокирован
6. Некорректный парсинг данных (например, при изменении структуры ответа на источнике)
7. Внутренние ошибки работы приложения (конкретизировать)
Требование к языкам:
1. Основной парсер – PHP
2. «Капчерезка» по согласованию с Заказчиком
Ответ передается в формате JSON.
Результат работ передается в виде приложения под Linux с документацией.