Долгое время писал парсеры на PHP в процедурном стиле. Решил теперь все переписать на ООП стиль. В качестве базы прочитал книгу "М. Зандстра PHP - объекты, шаблоны и методики программирования". Прошу дать пару советов по структуре парсера: какие сущности выделить, какое взаимодействие реализовать между классами, какие примерно нужно выделить интерфейсы или абстрактные классы. Просто хочу чтобы с точки зрения ООП все было правильно, рационально. Основная задача парсера такая: заходить на новостной сайт, по определенным правилом выдергивать ссылки на новости. Потом пройтись по новостям и выдернуть оттуда дату, заголовок и текст новости. Таких новостных сайтов туча. Для каждого из них в БД хранятся теги для выдергивания всей необходимой информации.
Если выборка по каким-то DOM условиям - то для этого уже есть скриптик phpQuery проводит парсинг по DOM и как раз работает с DOM как с объектами.
Апостиль в Лос-Анджелесе без лишних нервов и бумажной волокиты
Основные этапы разработки сайта для стоматологической клиники
Продвижение своими сайтами как стратегия роста и независимости