Задача такая, чтобы парсер сам выдергивал ссылки на статьи, новости и т.д. с сайта. То есть без указания ему регулярок, xpath и т.д. То есть определенный алгоритм, который самостоятельно распознает именно ссылки на новости. Чтобы пропускал мимо ссылки на рубрики, категории и т.д. У newspaper нашел такое, но ему удается это проделать не с каждым сайтом. То есть где то он находит 200 линков, а где то всего лишь 1. Буду благодарен за любую наводку, может какие то библиотеки, хотя мне кажется я все пересмотрел
Как развивать веб-проекты в 2026 году: технологии, контент E-E-A-T и факторы доверия
Современные инструменты для криптотрейдинга: как технологии помогают принимать решения
Апостиль в Лос-Анджелесе без лишних нервов и бумажной волокиты
Основные этапы разработки сайта для стоматологической клиники