Не могу подключить proxy к jsoup

314
25 апреля 2017, 06:20

Суть задачи распарсить страницу, вытащить список доменов, каждый из них проверить через jsoup(или нет?) на site:xdomain.com , дабы узнать количество страниц.Пробовал так:

System.setProperty("http.proxyHost", "195.178.146.166");
System.setProperty("http.proxyPort", "3133");
System.setProperty("https.proxyHost", "195.178.146.166");
System.setProperty("https.proxyPort", "3133");

ещё нашёл такие примеры:

Proxy proxy = new Proxy(
                Proxy.Type.HTTP,
                InetSocketAddress.createUnresolved("127.0.0.1", 8080)
              );
Document doc = Jsoup
                .connect(request)
                .proxy(proxy)
                .userAgent("Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)")
                .timeout(5000).get();

В итоге результат никакой,со второго исполнения кода запрос перестаёт возвращать количество страниц. Может кто сталкивался?

Answer 1

Вы можете указать proxy-сервер напрямую, без создания отдельного объекта.

Document doc = Jsoup
                .connect(request)
                .proxy("<имя хоста>", <номер порта>)
                .userAgent("Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)")
                .timeout(5000).get();
READ ALSO
Тормозит RecyclerView при добавлении текста

Тормозит RecyclerView при добавлении текста

Имеется RelativeLayout с RecyclerViewВыглядит так:

485
Как запустить один процесс из другого в Java

Как запустить один процесс из другого в Java

Стоит задача: написать две программы, запустить вторую через первуюДля второй программы сгенерировал ехе-шник через exe4j

244
В чем разница между ExecutorService и ForkJoinPool?

В чем разница между ExecutorService и ForkJoinPool?

В чем разница между старыми имплементациями ExecutorService из 15 и новой ForkJoinPool из 1

281
Странное поведение ConcurrentHashMap и SocketOutputStream

Странное поведение ConcurrentHashMap и SocketOutputStream

Сейчас писал функцию для сервера приложения и убил очень много времени на поиск ошибкиВопрос из разряда "почему", а не как исправить, хочу...

249