【发布时间】:2013-03-23 14:39:59
【问题描述】:
我是 C# 的新手。我正在 HtmlAgilityPack 中寻找类似的功能。在名为 BeautifulSoup 的 Python 解析库中存在名为 contents 的函数。我如何通过 HtmlAgility 做到这一点?
【问题讨论】:
标签: c# html-agility-pack
我是 C# 的新手。我正在 HtmlAgilityPack 中寻找类似的功能。在名为 BeautifulSoup 的 Python 解析库中存在名为 contents 的函数。我如何通过 HtmlAgility 做到这一点?
【问题讨论】:
标签: c# html-agility-pack
好的,那么首先获取包含所有内容的文档根目录
//create a new document
var _htmlDoc = new HtmlAgilityPack.HtmlDocument();
//fill it with html
_htmlDoc.Load(filePath) or _htmlDoc.LoadHtml(string...)
//get the document root node - it has all the contents
var docuemntNode = _htmlDoc.DocumentNode;
那么...使用 linq 或 xpath 查询节点
string xpathExpressionSting = "//p";
var contents = htmlDoc.DocumentNode.SelectNodes(xpathExpressionSting)
//this would get paragraph tag nodes
【讨论】: