Как пропарсить сайт с авторизацией?

178
15 декабря 2018, 15:00

нужно пропарсить https://dnevnik.mos.ru/manage/student_journal/, который требует авторизации С парсингом валюты или других сайтов, открытых без авторизации - это то понятно, но что делать если нужно парсить подобное? через что это можно реализовать?) буду рад любым объяснениям

Answer 1

Если там стоит капча(особенно ReCapcha):

  1. Открывать браузер вроде CEF что бы пользователь залогинился вручную.
  2. Вытягнуть из CEF куки
  3. Закрыть CEF и дальше работать с куками. При чем на много сессий. Просто через какой-то нюгет для работы с REST.

Если капча не стоит:

  1. Спарсить реквест логина и повторять его с подстановкой логина и пароля при помощи любой библиотеки для работы с REST.
  2. сохранить куки и токен
  3. дальше работать с ними програмно и доставать текст хтмл-а при помощи все того же REST.
READ ALSO
Импорт функции из DLL

Импорт функции из DLL

Мне необходимо импортировать функцию из DLL написанную на Delphi:

180
Определение типа в обобщенном методе

Определение типа в обобщенном методе

Мне нужен обобщенный метод, получающий коллекцию Control'ов из gridMain по критерию, переданному делегатом, опирающимся на их Tag (целое число)Задачу...

139
Защита приложения

Защита приложения

Есть такой вопрос:

138
Какой шейдер использовать?

Какой шейдер использовать?

Шейдеры только начинаю изучатьЗадача такая: у объекта есть полностью прозрачные и полностью непрозрачные части

173