Возникла необходимость написать свой краулер on Python. На данном этапе мне необходимо распарсить весь текст из html и удалить лишнее. Как вы понимаете, парсер должен правильно работать с разными сайтами, а у многих тэги с текстом различаются: на каких-то текст есть внутри title и h3/a, на каких-то внутри span. Как можно сделать универсальный парсер для текста? Использовать цикл и проверку на присутствующие в html тэги или есть вариант проще?
Апостиль в Лос-Анджелесе без лишних нервов и бумажной волокиты
Основные этапы разработки сайта для стоматологической клиники
Продвижение своими сайтами как стратегия роста и независимости