Есть такая задача, необходимо найти опрделенный вид товара на сайте. Как это возможно сделать с помощью JAVA? А если конкретнее, то есть запрос на следующий вид стали - г X120Mn12 / 1.3401, диаметр: 130мм, кол-во: 500 кг, находиться эта позиция по следующему адресу - https://www.steelinox.nl/en/qualities/special-qualities/1.3401-a128-x120mn12. Задача в том, что поиск должен быть более менее универсальным для разных сайтов, с разной структурой. Аналогичную задачу для сайтов с прйсами в PDF, я зделал следующим образом, распарсил PDF-файл с помощью pdfbox в txt, а дальше ишу строку с наибольшим совпадением входящих аргументов (характеристики металла на разных сайтах (..или на разных производствах?) приводяться по разному). То есть я поиск я передаю String[] и link на PDF файл, результат получаю в виде List c переменной в которой содержиться количество совпадений в строек с переданным массивом STring[], соответсвенно строки с наибольшим показателем наиболее отвечаю клиентскому запросу. Вот что то, наподобие с html страницами, может кто посоветует, причем с html ссылка на конкретную страницу не пройдет, можно давать только ссылку на хост (адрес сайта), поскольку структура сайтов может быть различная. Заранее спасибо!
Основные этапы разработки сайта для стоматологической клиники
Продвижение своими сайтами как стратегия роста и независимости