Всем привет, Выложил небольщой кусочек html-кода c 3-я группами
Alternative
Anime
Arabic
и нужно регуляркой разобрать группы с подэлементами. Эти группы имеют подэлементы завернутые в
list top-level-subgenres
но тогда 2я группа Anime будет пропущена - чего не хотелось бы.
Можно ли составить регурярку так чтобы попали все 3 группы с правильными подэлементами и 2я группа была пустой ?
Спасибо!
Не нужно парсить HTML. Воспользуйтесь DOMDocument или другими альтернативными средствами специально предназначенными для разбора HTML. Пример работы с DOMDocument:
# создаём парсер
$dom = new DOMDocument();
# Загружаем html строку
# @ перед вызовом заглушает ошибки т.к.
# loadHTML может кидать исключения при невалидном HTML
@$dom->loadHTML($html);
# получаем всем теги <a>
foreach($dom->getElementsByTagName('a') as $link) {
# печатаем содержимое <a href>
echo $link->getAttribute('href');
echo "<br />";
}
Сборка персонального компьютера от Artline: умный выбор для современных пользователей