【问题标题】:c# parse html using XPathDocumentc# 使用 XPathDocument 解析 html
【发布时间】:2011-04-25 19:25:09
【问题描述】:

我正在尝试使用 XPathDocument 解析一个 html 页面,但给出了错误,因为 html 不是 xml... 有没有办法做到这一点?

【问题讨论】:

标签: c# xpath html-parsing


【解决方案1】:

应该使用HtmlAgilityPack。还是最好的!

【讨论】:

    【解决方案2】:

    使用 Html Agility Pack 之类的东西,它可以将你的 html 加载到一个 DOM 对象中,例如 xpath 查询可以遍历该对象。

    除非您的 html 实际上是 xhtml,否则它通常不是具有正确开始和结束节点标记的有效 xml 结构。

    【讨论】:

    • 我想标记这个答案,但是 htmlagilitypack 不适用于我提供的文档,LoadFile() 方法没有返回值,也不会引发异常.该文档在我查询时似乎也没有返回任何内容,所以我假设代码在发生这种情况时“静默失败”?
    • 嗨@ConradB,您是否尝试过htmlagilitypack.codeplex.com/wikipage?title=Examples 的示例? Load 不应该返回任何东西,但它应该使您能够循环执行选择的节点。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-02-12
    • 2010-09-12
    • 2012-07-12
    • 2013-12-13
    • 1970-01-01
    • 2011-11-09
    相关资源
    最近更新 更多