【问题标题】:php lib for parsing html to DOM hierarchy tree用于将 html 解析为 DOM 层次结构树的 php lib
【发布时间】:2009-12-13 10:14:39
【问题描述】:

我需要一些 php 库来将 html 内容解析为 DOM 树 像这样:

html
 |--head
 |    |---title--title_content
 |    |---meta--meta_content
 |--body
 |    |---div
 |    |    |--div--div_content

..等等

并且还修复或清理无效的html。

ITS 不仅适用于 HTML,而且适用于任何 XML 样式标记语言的事件。 基本上是父子样式。

【问题讨论】:

    标签: php html parsing


    【解决方案1】:

    Simple HTML DOM 适用于 HTML,甚至是无效的 HTML,但我不确定它如何处理 XML。如果您正在寻找 XML 操作,php 文档有一个list of libraries

    【讨论】:

      【解决方案2】:

      我刚刚遇到QueryPath的好吃,感觉还不错。

      【讨论】:

        【解决方案3】:

        PHP 内置的Document Object Model 扩展有什么问题吗?有时有点笨拙,是的,但根据我的经验,它是内置的并且评估速度相当快,而 Simple HTML DOM(同样,根据我的经验)容易出现很多障碍和减速。

        【讨论】:

          猜你喜欢
          • 1970-01-01
          • 1970-01-01
          • 2014-09-02
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 2014-03-18
          • 1970-01-01
          • 2010-09-19
          相关资源
          最近更新 更多