Вот фрагмент Html кода:
<div>
<div>
<a></a>
<a></a>
<div><a><span></span>Text1</a></div>
</div>
<div>Text2</div>
</div>
C помощью:
var htmlNodes = htmlDoc.DocumentNode.SelectNodes("*");
foreach (var node in htmlNodes)
{
text += node.InnerText;
}
Я получаю такую строку:
"\r\n \r\n \r\n \r\n \r\n Text1\r\n Text2"
Могу ли я выдернуть просто текст ?
"Text1 Text2"
string text = "\r\n \r\n \r\n \r\n \r\n Text1\r\n Text2";
var str3 = new String(text.Where(ch => ch != '\r' && ch != '\n').ToArray()).Trim();
var str4 = str3.Split(' ').Where(ch => ch != String.Empty).ToArray();
string finalstring = String.Empty;
for (int i = 0; i <= str4.Length - 1; i++)
{
if (i != str4.Length - 1)
finalstring += str4[i] + " ";
else
finalstring += str4[i];
}
var str3 = new String(text.Where(ch => ch != '\r' && ch != '\n').ToArray()).Trim();
Сборка персонального компьютера от Artline: умный выбор для современных пользователей