【问题标题】:good way to go about doing page excerpts做页面摘录的好方法
【发布时间】:2010-01-22 09:22:14
【问题描述】:

我希望实现 facebook 在您将链接放入消息时所具有的效果 - 他们会从中刮取标题和一些图像。 我注意到他们也做得非常快。 (他们必须缓存一些重新发送的项目?)

有没有人对如何使用 PHP 解决这个问题有任何想法? 我可以以某种方式快速抓取页面的<title> 块而不卷曲整个内容吗?

谢谢!

【问题讨论】:

    标签: php facebook curl file-get-contents


    【解决方案1】:

    您可能不得不抓取整个页面并使用HTML DOM parser 撕掉标题标签。

    如您所说,如果您想要更快的速度,请考虑缓存结果。

    http://simplehtmldom.sourceforge.net/

    【讨论】:

    • 谢谢,我目前正在使用 simplehtmldom .. 它太慢了!加上 PHP 在做更大的网站时内存不足,我觉得那里必须有更好的解决方案......
    • 我对 cURL 了解不多,但它会下载所有内容吗?您可以将其限制为 HTML。
    • @daniel:SimpleHtmlDom 很棒,但正如你所说,它很慢。尝试使用 phps DOM 类 -> php.net/manual/en/book.dom.php
    猜你喜欢
    • 2014-10-24
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-08-04
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多