Как пропарсить сайт с авторизацией?

217

15 декабря 2018, 15:00

нужно пропарсить https://dnevnik.mos.ru/manage/student_journal/, который требует авторизации С парсингом валюты или других сайтов, открытых без авторизации - это то понятно, но что делать если нужно парсить подобное? через что это можно реализовать?) буду рад любым объяснениям

Answer 1

Если там стоит капча(особенно ReCapcha):

Открывать браузер вроде CEF что бы пользователь залогинился вручную.
Вытягнуть из CEF куки
Закрыть CEF и дальше работать с куками. При чем на много сессий. Просто через какой-то нюгет для работы с REST.

Если капча не стоит:

Спарсить реквест логина и повторять его с подстановкой логина и пароля при помощи любой библиотеки для работы с REST.
сохранить куки и токен
дальше работать с ними програмно и доставать текст хтмл-а при помощи все того же REST.

Создание эксклюзивного проекта в ABCname

ПОСЛЕДНИЕ ВОПРОСЫ

Все вопросы

ТОП-10

Все популярные вопросы

Импорт функции из DLL

Мне необходимо импортировать функцию из DLL написанную на Delphi:

223

Определение типа в обобщенном методе

Мне нужен обобщенный метод, получающий коллекцию Control'ов из gridMain по критерию, переданному делегатом, опирающимся на их Tag (целое число)Задачу...

187

Защита приложения

Есть такой вопрос:

181

Какой шейдер использовать?

Шейдеры только начинаю изучатьЗадача такая: у объекта есть полностью прозрачные и полностью непрозрачные части

219