【问题标题】:Get content of a table from remote site [duplicate]从远程站点获取表的内容[重复]
【发布时间】:2012-10-27 23:08:47
【问题描述】:

可能重复:
How to parse and process HTML with PHP?

我想使用 file_get_contents() 获取远程网站的内容 这个网站有我感兴趣的文本、图像和表格。该远程站点上有下一个表:

<table style="width: 100%" class="style36">
    <tr>
        <td style="width: 25%" class="style38">B3</td>
        <td style="width: 60%" class="style38">Las Flores</td>
        <td style="width: 15%" class="style38">0</td>
    </tr>
</table>

每个单元格上的值都是动态的,我想以最快、更可靠的方式查询它们。

我尝试将 file_get_contents 函数限制为仅读取 X 个字符,但由于页面是动态的,我无法真正知道我的表格从哪个字符开始。

提前致谢

【问题讨论】:

    标签: php


    【解决方案1】:

    我建议改用curl

    获得页面输出后,您可以使用各种工具来解析内容。谷歌将成为你的朋友,特别是如果你想找到一个 PHP HTML 解析器。

    PHP 有大量的 DOM 函数可供使用,因此您也可以自行开发。

    【讨论】:

      【解决方案2】:

      你会想看看一个概念调用抓取;有可用的网络抓取库,或者您可以使用 preg_match_all() 通过正则表达式获取所需的元素。 Scraping Library for PHP - phpQuery? 查看该链接。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2011-09-21
        • 2014-01-04
        • 1970-01-01
        • 2011-10-28
        • 1970-01-01
        • 2012-07-11
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多