Парсинг сайта с помощью anglesharp

290
21 сентября 2017, 13:03

Использую AngleSharp для парсинга сайта. Очень хорошая штука. Но возникла проблема. Вот мой код:

private void button1_Click(object sender, EventArgs e)
{
    string data = "Time = 12:00am temperature = 50";
    var Client = new System.Net.WebClient();
    Client.Credentials = System.Net.CredentialCache.DefaultCredentials;
    Client.Proxy.Credentials = System.Net.CredentialCache.DefaultCredentials;
    string text = Client.UploadString(textBox1.Text, data);
    var parser = new HtmlParser();
    var document = parser.Parse(text);
    var result = document.QuerySelector("body").TextContent;
    File.WriteAllText(@"D:\Текст сайта.doc", result, Encoding.UTF8);
    textBox4.Text = "Всё готово!";
}

Очистился весь сайт, но остались 3 проблемы. Надеюсь все решаемые:

  1. Остался javascript код.
  2. Здоровенные пробелы между строками в некоторых местах.
  3. Присутствует меню сайта + комментарии если они например есть. Как бы их убрать?

В общем как-то так. Как можно решить эти проблемы, если можно конечно?

READ ALSO
Инициализация полей UserControl 'a WPF

Инициализация полей UserControl 'a WPF

Передо мной стоит задача открыть изображения в сетке

213
Как через async\await вызвать метод DisconnectAsync у сокета?

Как через async\await вызвать метод DisconnectAsync у сокета?

Как через async\await вызвать метод DisconnectAsync и дождаться его завершения у сокета? Этот метод не поддерживает TAP паттернОн поддерживает только старые...

228
как обратиться к вложенной функции?

как обратиться к вложенной функции?

как обратиться к функции dsa?

312
Пояснить отрывок кода на javascript

Пояснить отрывок кода на javascript

Прошу пояснить словами что в нем происходит, соответственно для дальнейшего обучения

321