【问题标题】:any html/css parsing library for ruby & PHP?任何用于 ruby​​ 和 PHP 的 html/css 解析库?
【发布时间】:2010-01-21 11:52:03
【问题描述】:

我即将完成使用 mechanize&ruby 解析/抓取网站的脚本。

将来我需要将我的脚本移植到 PHP。

我的问题是

  • 如果有任何库可用于 ruby​​ 和 php 或
  • 是否有人可以推荐任何其他方法?

【问题讨论】:

    标签: php ruby parsing rubygems screen-scraping


    【解决方案1】:

    Ruby 和 Mechanize 没有 PHP 等价物。

    不过,Zend_Framework 提供了一些很棒的抓取相关库,包括

    • Zend_URI 和 Zend_HTTP_Client
    • Zend_Dom

    【讨论】:

      【解决方案2】:

      作为标准,PHP 带有多种解析 XML 的工具(而 DOM 可以处理很多格式不正确的 HTML)

      http://uk3.php.net/manual/en/refs.xml.php

      C.

      【讨论】:

        【解决方案3】:

        对于 PHP 中的 DOM 操作,请使用 DOMDocument class

        简单易行:)

        【讨论】:

          【解决方案4】:

          另一个用于 php 的 DOM 操作工具是 phpQuery

          【讨论】:

            猜你喜欢
            • 1970-01-01
            • 2011-03-14
            • 2018-06-30
            • 1970-01-01
            • 2013-09-10
            • 1970-01-01
            • 1970-01-01
            • 2011-02-25
            • 2015-04-05
            相关资源
            最近更新 更多