【发布时间】:2011-02-11 10:19:17
【问题描述】:
我在 XML::LibXML::Reader 文档中没有找到任何关于解析 HTML 的内容。我试图解析一个 HTML 站点,但它没有用。 我的结论是,XML::LibXML::Reader 不适用于 HTML 吗?
【问题讨论】:
标签: html perl xml-libxml
我在 XML::LibXML::Reader 文档中没有找到任何关于解析 HTML 的内容。我试图解析一个 HTML 站点,但它没有用。 我的结论是,XML::LibXML::Reader 不适用于 HTML 吗?
【问题讨论】:
标签: html perl xml-libxml
除非它真的是 XHTML,否则不会。 XML 比 HTML 更严格,XML 解析器通常无法解析 HTML。
HTML::TokeParser(或其基类HTML::PullParser)与XML::LibXML::Reader 最相似(但并非完全相似)。
您可能想查看HTML-Tree 以了解与 LibXML 类似的东西,它适用于 HTML。还有HTML::TreeBuilder::LibXML,它围绕 HTML-Tree 包装了一个更加兼容 LibXML 的接口。
【讨论】:
不,但HTML::TreeBuilder::LibXML 在 HTML 分析器上实现了兼容的接口。
【讨论】: