Общая информация
1. Парсер должен осуществлять поиск по запросу, передаваемого в рамках цепочки n8n в Программе (через ее оболочку) и формировать на основании полученных данных файлы для передачи дальнейшему элементу системы в рамках цепочки n8n.
2. Программа (в которой работает парсер) установлена на локальном сервере и состоит из оболочки и локальных данных, к которым нет доступа напрямую без оболочки. Т.е. обращение к локальным данным не через оболочку невозможно.
3. Программа работает на операционной системе Windows. Возможность использования других операционных систем необходимо проверять.
4. В рамках Проекта должна быть предусмотрена интеграция Парсера с другими элементами цепочки n8n для получения Запроса и передачи Файлов.
Подробное описание функционала Парсера
1.1 Парсер осуществляет комплекс действий по (i) поиску информации в Программе на основании Запроса и (ii) формированию Файлов, в каждом случае посредством осуществления следующих действий:
1.1.1 получает ввод (input) от предыдущего элемента цепочки n8n ("Запрос"). Ввод может представлять собой одно или несколько слов и/или словосочетаний, а также логические операторы ("И", "ИЛИ", "КРОМЕ"), которые должны использоваться для осуществления поиска в Программе;
1.1.2 на основании Запроса осуществляет последовательный поиск в Программе по 1-3 направлениям посредством имитации действий пользователя. Т.е. в рамках одного Запроса Парсер должен осуществить поиск от 1 до 3 раз (1 раз для 1 направления). Для смены направления посредством имитации действий пользователя Парсер должен выбирать определенные разделы в оболочке Программы. По каким именно направлениям будет осуществляться поиск в Программе будет сообщаться в Запросе;
1.1.3 после того как будет осуществлен поиск в Программе (поиск Программа выполняет самостоятельно) Парсер должен последовательно открывать ссылки, которые предложит Программа. При открытии ссылки начинает быть доступен (открывается) текст. Для каждого направления количество ссылок, которые необходимо будет открыть отличается. Общее количество ссылок, которые необходимо будет открыть в рамках суммы 3 направлений – 80;
1.1.4 открывшийся текст Парсер должен копировать. Объем каждого текста может значительно отличаться (если переводить объем текста в листы А4, то объем может быть от 1 до более 100 страниц). Крайне важно чтобы Парсер копировал текст без изменений и только в том виде, в котором он содержится в Программе;
1.1.5 скопированный текст Парсер помещает в файл. Для каждого направления Парсер создает свой отдельный внутренний файл ("Файл направления" все вместе "Файлы"). Т.е. в рамках одного Запроса Парсер должен сформировать в сумме 3 файла для каждого направления;
1.1.6 передает Файлы направлений следующим элементам Системы, т.е. осуществляет вывод (output); и
1.1.7 Парсер готов к получению нового Запроса, при этом старые Файлы или Запросы не должны влиять на результаты нового Запроса.
1.2 Для осуществления поиска на основании Запроса в Программе по заданным направлениям:
1.2.1 Парсер должен иметь функционал локального парсера (parser), т.е. программы для сбора и систематизации информации, размещенной на локальном сервере;
1.2.2 функционал парсера (parser) должен иметь возможность осуществления разветвленных действий, в зависимости от типов раздела, где осуществляется поиск, т.е. в соответствии с заданными направлениями.
1.3 Парсер предварительно формирует Файлы для их внутреннего использования в рамках Системы, как следствие, вывод (output) указанных Файлов Пользователю не предполагается. Файлы могут быть структурированы в любом машиночитаемом формате, позволяющем осуществить дословное цитирование.
1.4 Файлы формируются по 3 заранее заданным направлениям:
1.4.1 по первому направлению Файл направления включает в себя – не более 10 текстов;
1.4.2 по второму направлению Файл направления включает в себя – не более 60 текстов;
1.4.3 по третьему направлению Файл направления включает в себя – не более 10 текстов .
1.5 Обработка текста в Программе предпочтительно — копирование текста целиком. При этом возможна альтернатива — сохранение документа файлом из Программы (rtf / docx / pdf).
1.6 Формат Файлов, которые передаются дальше по цепочке docx или pdf.
Опубликован 25.09.2025 в 15:56
Заказ находится в архиве