【问题标题】:Get timestamp from a webpage?从网页获取时间戳?
【发布时间】:2011-08-08 10:21:53
【问题描述】:

有没有办法从网页中获取时间戳?在这种情况下,新闻报道网页。我尝试将它们隔离在 XHTML 的字符串内容中,但变化太多。我已经到处搜索了,但是任何人都能做的就是获取当前日期

【问题讨论】:

  • “时间戳”是指“最后修改”日期?
  • 是的,网页进入了一个字符串——我只是想把时间戳拉出来。但是在 XHTML 的不同上下文中有数百万个时间戳,我想知道 PHP 是否有一个函数
  • 是否网页的源代码在<meta> 标记中包含“最后修改”时间戳或什么?因为通常不会。该信息通常来自源代码中不可见的标头。但如果它存在,请以哪种形式显示,以便人们建议一种过滤它的方法

标签: php string url date timestamp


【解决方案1】:

您可以使用下面的代码获取标题。不过,没有多少网站会实施最后修改日期。

<?php
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_HEADER, TRUE);
curl_setopt($ch, CURLOPT_NOBODY, TRUE); // remove body
curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
$head = curl_exec($ch); 
?>

【讨论】:

  • 有趣。我想您必须对代码进行排序-只需选择最常出现的代码即可。我正在解码新闻提要,因此代码的多样性使系统无法正常工作-例如,路透社的故事只有两个公共线程-正文之前的 和正文之后的 .但不总是。哈哈。
【解决方案2】:

您能否检查 Last-Modified 响应标头。请参阅 for details 的完整标题列表。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2014-11-21
    • 1970-01-01
    • 2011-09-21
    • 2011-12-08
    • 1970-01-01
    • 2019-08-09
    • 1970-01-01
    相关资源
    最近更新 更多