PHP Simple HTML DOM Parser не парсит некоторые страницы

79
15 июня 2021, 02:30

Использую шаблонный код:

require_once 'library/simplehtmldom.php';
$html = file_get_html('https://prnt.sc/lzz0dq');
echo $html;

Все другие рандомные сайты выводит без проблем, но тот, что сейчас в коде - никак не хочет. Возвращает bool(false) и все

проверял ini_get('allow_url_fopen') - возвращает 1.

Все форумы переискал - ничего.

Answer 1

prnt.sc не так прост, как кажется. Он не хочет чтобы его парсили и защищается тем, что проверяет заголовки запроса. Я добавил в запрос заголовок User-Agent, скопированный из моего браузера, и получил ответ 200.

Притворитесь браузером и получите ответ.

Как добавить заголовки уже знают на so https://stackoverflow.com/questions/1945511/seting-user-agent-param-in-php-simple-html-dom-parser

READ ALSO
Что означает код while (i++ < …)?

Что означает код while (i++ < …)?

Что означает код в данной строке? я начинающий программист и для меня это очень странный код, такого нигде не встречал до сегодняшнего дня

84
Как обработать Exception и сделать реконнект?

Как обработать Exception и сделать реконнект?

Имеется метод, который коннектится по заданному url через прокси

101
boolean и размер в памяти

boolean и размер в памяти

Размер (бит) boolean 8 (в массивах), 32 (не в массивах используется int)Вот понимаю что всегда int это 32 бита

100
Как при помощи Joda получить 2019-08-22T13:26:36.447019Z

Как при помощи Joda получить 2019-08-22T13:26:36.447019Z

Нужно получить формат времени ввиде: 2019-08-22T13:26:36447019Z, но как это сделать что-то не вкурю

116