【问题标题】:Get original created date of PDF from URL从 URL 获取 PDF 的原始创建日期
【发布时间】:2013-01-24 21:50:08
【问题描述】:

我正在处理此 URL 末尾的 pdf

https://www2.blackrock.com/webcore/litService/search/getDocument.seam?venue=PUB_INS&source=CONTENT&serviceName=PublicServiceView&ContentID=51648

通过查看,我们可以看到它是12/31/2012 版本。有没有办法可以在 pdf 本身上获取一些时间戳数据?上传日期、创建日期、修改日期,以及该范围内的任何内容?

我尝试了以下方法,都返回12/31/1969

$pdfURL = 'https://www2.blackrock.com/webcore/litService/search/getDocument.seam?venue=PUB_INS&source=CONTENT&serviceName=PublicServiceView&ContentID=51648';
$rawPDF = file_get_contents($pdfURL);
echo date("F d Y H:i:s.", filemtime($pdfURL));

-AND-

echo date("F d Y H:i:s.", filemtime($rawPDF));

我也试过

$headerArray = array();
$headerArray = get_headers($pdfURL, 1);
echo "<PRE>";
var_dump($headerArray);
echo "</PRE>";

但是Last-Modified 不存在于标头数组中

【问题讨论】:

  • [这篇文章] 对您的情况有帮助吗? 【本文】:stackoverflow.com/questions/4326604/…
  • 我认为这会起作用,但我不完全确定如何在 php 中使用它。我想我得做一些研究
  • 有一个 PHP 函数 get_headers 使用它然后遍历返回的表并查找 Last-Modified
  • 对于那个 URL 没有“最后修改”。
  • 我无法访问此网址,所以我无法判断,但从我在自己网站上看到的内容来看,Last-modified 字段可用于直接访问的文件(比如我将鼠标悬停在链接上最后有一个.PDF的真实路径),而对于从脚本分配的文件我找不到它(比如我在哪里有download.php?link=file.pdf

标签: php url date pdf


【解决方案1】:

我之前回答过,因为我只提供了一个链接,版主删除了我的回答并转换为评论。现在让我们根据我们的 cmets 尝试更完整的答案:

根据我的分析,给定链接的 HTTP 标头包含 Last-modified 字段。但前提是链接直接指向文件。但是,当您看到链接是 somepage.pgp?file=file.pdf 类型时,Last-modified 将不存在。 在第一种情况下,可以使用 php 函数 get_headers() 来读取相关字段。我是后一种情况,恐怕我帮不了你。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-09-27
    • 2018-02-09
    • 2015-03-23
    • 1970-01-01
    • 1970-01-01
    • 2015-04-24
    相关资源
    最近更新 更多