【发布时间】:2011-09-08 00:20:43
【问题描述】:
我想阅读 PDF 并获取其页面列表和每页的大小。我不需要以任何方式操纵它,只需阅读即可。
目前正在试用 pyPdf,它可以满足我的所有需求,除了获取页面大小的方法。了解我可能不得不遍历,因为 pdf 文档中的页面大小可能会有所不同。我可以使用其他库/方法吗?
我尝试使用 PIL,一些在线食谱甚至使用 d=Image(imagefilename),但它从不读取我的任何 PDF - 它读取我扔给它的所有其他内容 - 甚至一些我不知道 PIL 可以做的事情.
感谢任何指导 - 我在 windows 7 64, python25 上(因为我也做 GAE 的东西),但我很高兴在 Linux 或更现代的 pythiis 上做。
【问题讨论】:
-
PIL 不(而且很可能永远不会)支持 PDF,因为它们是一种非常复杂的矢量图形。 PIL 专注于光栅图像。使用 PDF 是专用库的任务,例如 pikepdf 或 pymupdf。