Лариса Крашакова [Klaura]
Klaura
Лариса Крашакова [Klaura]
На сайте 6 лет и 1 месяц (заходила 2 месяца 26 дней назад)
+ 11  0  - 0
7
509.67
Рейтинг509.67
509.67
Отзывы+ 11  0  - 0
+ 11  0  - 0
Все (3)       Проекты (3)        Вакансии (0)       Конкурсы (0)
Опубликовать проект
30 Декабря 2018
По договоренности
Апаче редирект нужно сделать чтобы маскировало новый юрл (Убунту). Редирект сделать я могу но никак не могу маскировать новый юрл. Убунту, вордпресс (если важно) на сервере. Сообщите сколько стоит и повремени сколько займет. Спасибо.

Прошло времени с момента публикации: 2 месяца 26 дней 13 часов 46 минут
Раздел: Программирование / Системный администратор

04 Апреля 2018
По договоренности
Вытащить емейл адрес и имя из пдф документа (не скан). Всего 250 страниц 10 имейлов с именами на каждой странице. Пример документа прилагается. Сообщите пож-та цену и время необходимое. Спасибо

Прошло времени с момента публикации: 11 месяцев 21 день 20 часов 11 минут
Раздел: Программирование / Прикладное программирование

20 Декабря 2017
По договоренности
Пожалуйста отвечайте только если вы уже работали ранее с PDF Box или iText или чем-то похожим и знаете как решать проблему описанную ниже.

Что нам надо: Utility/jar/класс который мы можем вызывать с нашего java аппликейшн на Linux сервере на Tomcat с Java 8.

Проблема: нужно выдать текст из пдф файлов (что называется native pdf или searcheable pdf – не сканы) с сохраненными позициями текста – то есть нужно чтобы каждый тоукен/слово выдавало с x/y начало/конец позиции и координаты начало / конца вертикальных и горизонтальных линий. Нам нужно получить только текст который конечный пользователь может видеть, и не выдавать скрытый текст который человек видеть не может, и если выдает полный текст то нужен флаг какая часть текста видима и какая скрыта для конечного пользователя. Прилагаю примеры файлов где есть скрытый текст который нужно убирать.

Мы используем Apache PDFBox – но их PDFTextStripper выдает весь текст (видимый и не видимый). Чтобы понять какой текст является не видимым нужно самим читать процессить пдф инструкции и считать является ли текст покрытым каким либо другим элементом (является ли текст скрытым) или нет. Нам нужен только видимый текст.

Есть еще другие библиотеки iText, Tika, Acrobat SDK – можно использовать и их если есть опыт.

Сообщите есть ли опыт решения такой задачи и в какой библиотеке, ваша оценка по времени и стоимости решения.

Прошло времени с момента публикации: 1 год 3 месяца 5 дней 1 час 50 минут
Раздел: Программирование / Прикладное программирование