【发布时间】:2013-02-18 03:34:40
【问题描述】:
我收到了顶级 PDF 包含子 PDF 的“打包 PDF”文件版本。
顶级 PDF 主要用作容器。打包在 Adobe 阅读器中并不总是很明显(例如,当使用 pdftk 打包时,链接不显示)。我在谷歌上搜索这个词或在我 2012 年的书(“Whittington”、“PDF Explained”、O'Reilly)中几乎找不到。
这是 PDF 的标准部分吗?如果是这样,我将不胜感激。 PDFBox可以分析吗?
【问题讨论】:
-
相信你说的是嵌入式文件,我对PDFBox不是很熟悉,但是there is an example here。
-
谢谢@Jesse。你可能是对的(你的参考有错字应该是 pdfbox.apache.org/userguide/file_references.html )。我欢迎其他 cmets - 似乎这个词已经足够广泛以至于引起混淆。
-
这里 (blog.didierstevens.com/2009/07/01/…) 是一种相当偷偷摸摸的嵌入文档的方式,因此 Adobe Readed 无法检测到它。看起来嵌入相当脆弱或可以被颠覆
-
正如我在下面的回答中提到的,PDF 知道嵌入式文件流以及使 PDF 阅读器知道它们的两种主要方法。要决定 PDFBox 是否可以访问那些连 Adobe Reader 都看不到附件的有趣 PDF,有必要检查这些文件是如何被公开的(如果有的话!)。因此,请自行检查或提供样品进行检查。