Скачивание веб страницы.. Java

100
13 февраля 2021, 13:00

Доброго времени суток всем! Есть такое задание, вот оно:

Имеются две хеш-таблицы. Ключом являются URL. Значением – html-код страницы. Обе таблицы отражают все страницы некоторого заданного множества веб-сайтов. Первая таблица - состояние сайтов на текущий день, а вторая - на предыдущий. Необходимо написать приложение, которое, пользуясь этими таблицами, составило и отправило бы по заданному e-mail письмо следующего формата:

Здравствуйте, Глеб Иванович! За последние сутки на сайтах произошли следующие изменения: 1) Исчезли следующие страницы: {список URL-ов} 2) Появились следующие новые страницы {список URL-ов } 3) Изменились следующие страницы {список URL-ов }

С "Изменились следующие страницы" понятно что делать, просто сравниваем значения по ключу и все, а вот с "Исчезли следующие страницы" и "Появились следующие страницы" что делать не совсем понимаю. Ну и в принципе как мне получить разные состояния страниц одного URLа (состояние на вчера и на сегодня)?

READ ALSO
Проблема с парсингом через HtmlUnit java

Проблема с парсингом через HtmlUnit java

Задача состоит в том, чтобы передать страничке элементы и получить назад вернувшиеся данныеДля я пробовал использовать Jsoup, а затем HtmlUnit

117
org.hibernate.exception.GenericJDBCException: Could not open connection

org.hibernate.exception.GenericJDBCException: Could not open connection

Решил изучить один проектТам вот такое обращение к БД(MySQL) и конфиг

109
Обработка List<> через Stream API

Обработка List<> через Stream API

Имеется класс, в котором есть поле Path directory; и метод, который возвращает список объектов - List getAllStorted

186
Потокобезопасный ArrayList

Потокобезопасный ArrayList

Пишу свою реализацию потокобезопасного эррэй листа на CAS-блокировках (не спрашивайте зачем)Столкнулся с некоторым непонятным мне поведением...

135