【发布时间】:2011-05-11 08:16:59
【问题描述】:
我正在尝试使用 pyPdf 从多页 PDF 中提取和打印页面。问题是,没有从某些页面中提取文本。我在这里放了一个示例文件:
http://www.4shared.com/document/kmJF67E4/forms.html
如果您运行以下命令,前 81 个页面不会返回任何文本,而最后 11 个页面会正确提取。有人可以帮忙吗?
from pyPdf import PdfFileReader
input = PdfFileReader(file("forms.pdf", "rb"))
for page in input1.pages:
print page.extractText()
【问题讨论】: