Парсинг информации с сайта

303
13 февраля 2017, 14:30

Решил написать приложение для 1 сайта, для парсинга информации решил использовать jsoup, но столкнулся с проблемой, что некоторая информация на сайте хранится в джава-скриптах, в итоге я получаю html страницу, в которой нету этой информации(пишет:javascript отключен), интересует вопрос, как решить эту проблему либо альтернативные варианты) с парсингом только начинаю работать, заранее спасибо.

Answer 1

Javascript нельзя получить, но можно попробовать получить результат его выполнения. Скорее всего, то что вы видите на странице в браузере, это результат какого-то get/post запроса, соотвественно вам необходимо отправить такой же запрос с такими же параметрами и вы получите свой результат. Используйте fiddler2 либо вкладку network (в chrome), для подробного изучения всех запросов которые отправляет ваша страница.

Answer 2

Как вариант можно создавать скрытый WebView, грузить в него нужную страницу, а дальше выполнять JS для сбора данных со страницы.

Как получать результат выполнения функций JS.

Как выполнить JS в WebView.

READ ALSO
В классе Main выбивает ошибку “The public type Main must be defined in its own file”

В классе Main выбивает ошибку “The public type Main must be defined in its own file”

Публичный класс Main должен быть в собственном файле - это написано прямо в ошибке человеческим языком, почему бы не попытаться прочитать, что...

411
Как сделать проверку в onStartCommand

Как сделать проверку в onStartCommand

Делаю запросы через startService в ServiceКак сделать проверку в onStartCommand

288
Android. Ошибка при конвертации Set<String> в String[]

Android. Ошибка при конвертации Set<String> в String[]

Пытаюсь достать данные из SharedPreference всей пачкой по ключу, но не получается конвертнуть результат в String[]

285