【问题标题】:Does XML::LibXML::Reader read HTML?XML::LibXML::Reader 是否读取 HTML?
【发布时间】:2011-02-11 10:19:17
【问题描述】:

我在 XML::LibXML::Reader 文档中没有找到任何关于解析 HTML 的内容。我试图解析一个 HTML 站点,但它没有用。 我的结论是,XML::LibXML::Reader 不适用于 HTML 吗?

【问题讨论】:

    标签: html perl xml-libxml


    【解决方案1】:

    除非它真的是 XHTML,否则不会。 XML 比 HTML 更严格,XML 解析器通常无法解析 HTML。

    HTML::TokeParser(或其基类HTML::PullParser)与XML::LibXML::Reader 最相似(但并非完全相似)。

    您可能想查看HTML-Tree 以了解与 LibXML 类似的东西,它适用于 HTML。还有HTML::TreeBuilder::LibXML,它围绕 HTML-Tree 包装了一个更加兼容 LibXML 的接口。

    【讨论】:

      【解决方案2】:

      不,但HTML::TreeBuilder::LibXML 在 HTML 分析器上实现了兼容的接口。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2019-11-15
        • 1970-01-01
        • 2020-02-15
        • 1970-01-01
        • 1970-01-01
        • 2017-07-16
        • 2010-12-15
        • 1970-01-01
        相关资源
        最近更新 更多