【发布时间】:2018-03-19 13:30:09
【问题描述】:
在使用 HtmlAgilityPack 时遇到了问题。我无法解析西里尔文字,它显示为一些未知符号。
HtmlWeb webGet = new HtmlWeb();
webGet.OverrideEncoding = Encoding.UTF8;
HtmlAgilityPack.HtmlDocument doc = webGet.Load("http://vk.com/glitchhop");
HtmlNode myNode = doc.DocumentNode.SelectSingleNode("//div[@id='page_wall_posts']/*[2]//div[@class='wall_post_text']");
if (myNode != null)
return myNode.InnerText;
else return "Nothing found";
还附上错误示例以及该文本的外观
【问题讨论】: