Парсинг Web-сайтов на PHP

311
04 июня 2017, 21:23

Как мне скопировать содержимое каждой публикации с сайта если я спарсил ссылки на каждую публикацию.

Помогите мне сделать PHP функцию для извлечения текста по заданной ссылке!

Я написал скрипт который парсит с каждой публикации заголовок и ссылку на эту публикацию, помогите мне написать функцию которая будет парсить за ссылками содержание каждой публикации!

header('Content-type: text/html; charset=utf-8');
require 'phpQuery.php';
function print_arr($arr){
    echo '<pre>' . print_r($arr, true) . '</pre>';
}
$url = 'http://goruzont.blogspot.com/';
$file = file_get_contents($url);
$doc = phpQuery::newDocument($file);
foreach($doc->find('.blog-posts .post-outer .post') as $article){
    $article = pq($article);
    $text = $article->find('.entry-title a')->html();
    print_arr($text);
    $texturl = $article->find('.entry-title a')->attr('href');
    echo $texturl;
}
Answer 1

А чем парсинг ссылок отличается от парсинга содержимого страницы по этой ссылке? Получаете содержимое страницы по ссылке (вы же ее уже знаете) и вытаскиваете нужную инфу.

Правильным думаю будет лучше использовать curl, а не file_get_contents.

READ ALSO
Как вывести цену товара в woocomerce?

Как вывести цену товара в woocomerce?

Всем доброго времени сутокНужно сделать калькулятор для товаров,на каждой странице,для этого нужно в инпут вставить цену товара,на странице...

381
Symfony 3, запись JSON данных в БД

Symfony 3, запись JSON данных в БД

Здравствуйте! У меня такой вопрос

392
Скрипты выгрузки данных [требует правки]

Скрипты выгрузки данных [требует правки]

У меня есть скрипт выгрузки данных из бдКак корректно его можно описать в дипломной работе

215
Неправильная настройка Apache

Неправильная настройка Apache

Есть несколько сайтов на сервереКогда открываешь произвольный домен (которого не существует), - afkla

276