Возникла необходимость написать свой краулер on Python. На данном этапе мне необходимо распарсить весь текст из html и удалить лишнее. Как вы понимаете, парсер должен правильно работать с разными сайтами, а у многих тэги с текстом различаются: на каких-то текст есть внутри title и h3/a, на каких-то внутри span. Как можно сделать универсальный парсер для текста? Использовать цикл и проверку на присутствующие в html тэги или есть вариант проще?
Айфон мало держит заряд, разбираемся с проблемой вместе с AppLab
Перевод документов на английский язык: Важность и ключевые аспекты
Какие существуют виды рекламных бордов и как выбрать подходящий?
При нажатии на кнопку «Добавить статью», появляется форма с двумя полями: Заголовок статьи и Описание статьи и кнопкой закрытьПосле нажатия...
Задание лабораторной работы - оформить сайт-визитку (одна или несколько страниц)Страница должна быть реализована с использованием CSS и JS
Купил себе недавно мак и не нашел notepad++ для него в интеренетеКаким редактором пользуються яблокофилы?