Возникла необходимость написать свой краулер on Python. На данном этапе мне необходимо распарсить весь текст из html и удалить лишнее. Как вы понимаете, парсер должен правильно работать с разными сайтами, а у многих тэги с текстом различаются: на каких-то текст есть внутри title и h3/a, на каких-то внутри span. Как можно сделать универсальный парсер для текста? Использовать цикл и проверку на присутствующие в html тэги или есть вариант проще?
Кофе для программистов: как напиток влияет на продуктивность кодеров?
Рекламные вывески: как привлечь внимание и увеличить продажи
Стратегії та тренди в SMM - Технології, що формують майбутнє сьогодні
Выделенный сервер, что это, для чего нужен и какие характеристики важны?
Современные решения для бизнеса: как облачные и виртуальные технологии меняют рынок
При нажатии на кнопку «Добавить статью», появляется форма с двумя полями: Заголовок статьи и Описание статьи и кнопкой закрытьПосле нажатия...
Задание лабораторной работы - оформить сайт-визитку (одна или несколько страниц)Страница должна быть реализована с использованием CSS и JS
Купил себе недавно мак и не нашел notepad++ для него в интеренетеКаким редактором пользуються яблокофилы?