Здравствуйте.
На страницах, которые парсятся по simple html dom (список компаний), иногда встречаются email'ы. Проблема в том, что проследить структуру, и определить элемент, внутри которого они встречаются, невозможно. Они внутри текста, заключённого то в div, то в p, то вообще в li, причем то в начале, то в середине, то в конце текста. В общем, полный хаос. Единственное, что есть среди них общего - значок @. Вопрос: как их добыть? Спасибо!
P.S. Для особо щепетильных - гарантирую, что собранная база не будет использоваться для спама, а только для наполнения каталога компаний на сайте.
Как развивать веб-проекты в 2026 году: технологии, контент E-E-A-T и факторы доверия
Современные инструменты для криптотрейдинга: как технологии помогают принимать решения
Апостиль в Лос-Анджелесе без лишних нервов и бумажной волокиты
Основные этапы разработки сайта для стоматологической клиники