Хранение документов в elasticsearch

426
15 октября 2017, 21:18

Начал смотреть в организацию удобного поиска в каталоге документов, выбор остановил на elasticsearch как поисковый движок и клиент для загрузки/поиска/вывода результатов на Java. Но входе постепенного погружения в выбранный стек технологий запутался кардинально. Вопросов несколько: Могу ли я каким то образом загрузить документы 1.pdf, 2.doc, 3.exl и т.д. По следующему алгоритму. Я передаю путь к файлу на серверElasticsearch:9200, а elastic преобразует его в JSON(т.е. сам анализирует содержимое файла, и извлекает необходимую информацию) и складывает в папку и сохраняет ссылку у себя в данных. Далее я в поимке ввожу слово "тест" и он мне выдает список JSON объектов где это слово встречается, а я потом уже из возвращенных данных извлекаю ссылку и выкачиваю/открываю файл? Или я должен сам сформировать JSON(т.е. руками запрограммировать чтения данных из файла, если да то если ограничения на размер информации, а то у меня файлы бывают по 200 - 300 листов в .pdf/.doc формате) считанные данные установить в "tag" и передать на сервер?

READ ALSO
Как брать данные понемногу?

Как брать данные понемногу?

Есть сервис и при обращении к нему он возвращает ответ обьемом 20+мб и я парсю эти данныеНо вот беда если вдруг сеть оборвется я он загрузил...

276
В каком формате получать данные на сервере JAVA

В каком формате получать данные на сервере JAVA

Здравствуйте! Подскажите пожалуйстаНужно сделать сервер со Spring'ом

228
Будет ли неопределенный порядок, если LinkedHashMap перевести в ArrayList?

Будет ли неопределенный порядок, если LinkedHashMap перевести в ArrayList?

LinkedHashMap не знает ничего про индексациюА если я переведу его в ArrayList так:

192
Что вызывает исключение?

Что вызывает исключение?

Приложение падает, но как понять, что и где заставляет его падать? Смотрел debugger'ом, но там все приблизительно тоже самое, нет ни одного метода...

240