Jsoup.connect() Получить документ полностью

120
21 марта 2021, 12:50

Проблема в следующем: использую библиотеку Jsoup для парсинга HTML страниц, но загвоздка в том, что на некоторых страницах некоторые элементы генерируются js при загрузке страницы (на мой взгляд равносильно подключению к этой странице. Однако, когда я получаю Document путем Jsoup.connect(url), я получаю все элементы, кроме тех, которые генерируются таким образом (в отличии от просмотра в браузере, например). Вопрос: Есть ли возможность получить документ в таком же виде, в каком я вижу его в Google Chrome - F12 - Elements?

Answer 1

С помощью JSOUP это невозможно. Так вы получите только статический контент, динамический не будет получен.

У вас 2 пути:

  1. Изучить какой запрос отправляет сайт при подгрузке данных и отправлять его. Так вы получите данные, которые динамически сайтом подгружаются.
  2. Используя Selenium эмулировать программно браузер и в нём, программно прокрутив страницу, получить динамически отображаемый HTML. Это сложный, долгий способ, но иногда только это и остаётся.
READ ALSO
Arrays.asList и Collections.addAll не работают с int [] array?

Arrays.asList и Collections.addAll не работают с int [] array?

вот так привести массив в List могу

110
Как сделать перезапуск spring?

Как сделать перезапуск spring?

Использую spring с docker-composeМне нужно чтобы при падении контейнера spring он перезапускался, определенное кол-во раз

90
Сложный палиндром

Сложный палиндром

Дана строкаИз данной строки необходимо сделать палиндром следующим образом:

123
Проблема с веб приложением Java, Spring Boot

Проблема с веб приложением Java, Spring Boot

Имеется Spring boot веб приложениеПри запуске с IntelliJ Idea сервер стартует, все работает нормально

86