【发布时间】:2013-01-24 21:50:08
【问题描述】:
我正在处理此 URL 末尾的 pdf
https://www2.blackrock.com/webcore/litService/search/getDocument.seam?venue=PUB_INS&source=CONTENT&serviceName=PublicServiceView&ContentID=51648
通过查看,我们可以看到它是12/31/2012 版本。有没有办法可以在 pdf 本身上获取一些时间戳数据?上传日期、创建日期、修改日期,以及该范围内的任何内容?
我尝试了以下方法,都返回12/31/1969
$pdfURL = 'https://www2.blackrock.com/webcore/litService/search/getDocument.seam?venue=PUB_INS&source=CONTENT&serviceName=PublicServiceView&ContentID=51648';
$rawPDF = file_get_contents($pdfURL);
echo date("F d Y H:i:s.", filemtime($pdfURL));
-AND-
echo date("F d Y H:i:s.", filemtime($rawPDF));
我也试过
$headerArray = array();
$headerArray = get_headers($pdfURL, 1);
echo "<PRE>";
var_dump($headerArray);
echo "</PRE>";
但是Last-Modified 不存在于标头数组中
【问题讨论】:
-
[这篇文章] 对您的情况有帮助吗? 【本文】:stackoverflow.com/questions/4326604/…
-
我认为这会起作用,但我不完全确定如何在 php 中使用它。我想我得做一些研究
-
有一个 PHP 函数 get_headers 使用它然后遍历返回的表并查找
Last-Modified -
对于那个 URL 没有“最后修改”。
-
我无法访问此网址,所以我无法判断,但从我在自己网站上看到的内容来看,Last-modified 字段可用于直接访问的文件(比如我将鼠标悬停在链接上最后有一个.PDF的真实路径),而对于从脚本分配的文件我找不到它(比如我在哪里有download.php?link=file.pdf