поиск определенного tag в на сайте

84
12 марта 2021, 12:00

Есть такая задача, необходимо найти опрделенный вид товара на сайте. Как это возможно сделать с помощью JAVA? А если конкретнее, то есть запрос на следующий вид стали - г X120Mn12 / 1.3401, диаметр: 130мм, кол-во: 500 кг, находиться эта позиция по следующему адресу - https://www.steelinox.nl/en/qualities/special-qualities/1.3401-a128-x120mn12. Задача в том, что поиск должен быть более менее универсальным для разных сайтов, с разной структурой. Аналогичную задачу для сайтов с прйсами в PDF, я зделал следующим образом, распарсил PDF-файл с помощью pdfbox в txt, а дальше ишу строку с наибольшим совпадением входящих аргументов (характеристики металла на разных сайтах (..или на разных производствах?) приводяться по разному). То есть я поиск я передаю String[] и link на PDF файл, результат получаю в виде List c переменной в которой содержиться количество совпадений в строек с переданным массивом STring[], соответсвенно строки с наибольшим показателем наиболее отвечаю клиентскому запросу. Вот что то, наподобие с html страницами, может кто посоветует, причем с html ссылка на конкретную страницу не пройдет, можно давать только ссылку на хост (адрес сайта), поскольку структура сайтов может быть различная. Заранее спасибо!

READ ALSO
WebView не видит изменений в коде HTML/JS

WebView не видит изменений в коде HTML/JS

WebView читает локальный indexhtml с внутренний памяти приложения

65
Почему тега изображения нет в скачанном HTML и как его спарсить?

Почему тега изображения нет в скачанном HTML и как его спарсить?

ПримерВот тут, в самом нижнем посте картинка с котиком, под спойлером:

95
Получить значение из ComboBox

Получить значение из ComboBox

Есть коллекция Dictionary(string,int) которая привязана к ComboBoxПри выборе 1 из пунктов в ComboBox мне необходимо положить значения взятые из него в разные...

101
Ошибка The operation cannot be completed because the DbContext has been disposed

Ошибка The operation cannot be completed because the DbContext has been disposed

Я решил добавить Ninject в проект из Identity(Проект Web API)Без него все работало нормально

119