【发布时间】:2018-03-28 15:20:50
【问题描述】:
我正在使用 AngleSharp 为网站编写解析器,我最终需要获取 XML。
在xml中解析的时候,解析段脚本有问题,因为有""这样的符号。 编号的行出现错误
我该如何解决这种情况(我需要使用 AngleSharp)?我尝试了不同的网站,结果是一样的
var config = Configuration.Default
.WithCss()
.WithDefaultLoader();
var address = Url.Create("https://www.google.com/");
var document = BrowsingContext.New(config).OpenAsync(address).GetAwaiter().GetResult();
XmlDocument xmlDocument = new XmlDocument();
var xDocument = new HtmlParser().Parse(document.DocumentElement.InnerHtml);
var formatter = new AngleSharp.Xml.XmlMarkupFormatter();
var result = xDocument.ToHtml(formatter);
xmlDocument.LoadXml(result); //1
var parserXML = new XmlParser().Parse(document.DocumentElement.InnerHtml);//2
xmlDocument.LoadXml(parserXML.ToHtml());
【问题讨论】:
标签: anglesharp