【问题标题】:Should I use DomDocument for parsing html code我应该使用 DomDocument 来解析 html 代码吗
【发布时间】:2011-04-22 17:01:48
【问题描述】:

我已经尽力通过研究自己回答这个问题,但我仍然有点担心我是否使用了正确的东西。 基本上我正在使用 DomDocument 库为我的框架构建一个类似 jQuery 的主题解析器。现在随着网络的发展,HTML 以不同的形状和大小出现,例如 HTML 4、HTML 5、XHTML、XHTML 5 等...... 我在 DomDocument 中发现的问题是,如果你给它提供 HTML 代码,它只有在符合标准的 XHTML 时才能使用它。 我知道它可以将其转换为 XHTML,并且我可以使用 tidy 库来使代码可以接受,但我主要担心的是:如果使用我的框架的开发人员有一个使用所有很酷(有争议的)新 HTML 5 功能的主题,如一旦他将它传递给我的框架,它就会发脾气或将其转换为 XHTML,这很糟糕。

所以我的问题是: DomDocument 是我需要的最方便的库吗?

有没有办法让它适用于所有不同的 HTML 变体?

【问题讨论】:

    标签: php html dom xhtml document


    【解决方案1】:

    DOMDocument 可以解析非 XHTML 文件。只需设置适当的开关:

        libxml_use_internal_errors ( true );
    
        $dom = new DOMDocument;
        $dom -> formatOutput = true;
        $dom -> substituteEntities = false;
        $dom -> recover = true;
        $dom -> strictErrorChecking = false;
    

    【讨论】:

      猜你喜欢
      • 2011-07-19
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2015-07-17
      • 2012-06-23
      • 2011-02-04
      • 2020-12-21
      • 1970-01-01
      相关资源
      最近更新 更多