Бюджет:
25 000 руб
Имеется хранилище s3 с загруженными HTML файлами (десятки тысяч, со временем миллионы). HTML файлы были сконвертированы из различных форматов, таких как DOC, PDF, XML, содержат только текст и минимальную разметку, вес файла обычно в пределах 100KB.
Требуется специалист для настройки и развертывания Elasticsearch на сервере для обеспечения быстрого поиска по тексту этих документов. Результатом поискового запроса должен быть список документов и место в них, где найден искомый отрывок.