【发布时间】:2015-06-24 16:16:26
【问题描述】:
我需要解析一个远程 pdf 文件。使用 PyPDF2,它可以由 PdfReader(f) 完成,其中 f=urllib.request.urlopen("some-url").read() 。 PdfReader 无法使用 f,并且似乎必须对 f 进行解码。 decode() 中应该使用什么参数,或者必须使用其他方法。
【问题讨论】:
标签: pdf python-3.x decode pypdf
我需要解析一个远程 pdf 文件。使用 PyPDF2,它可以由 PdfReader(f) 完成,其中 f=urllib.request.urlopen("some-url").read() 。 PdfReader 无法使用 f,并且似乎必须对 f 进行解码。 decode() 中应该使用什么参数,或者必须使用其他方法。
【问题讨论】:
标签: pdf python-3.x decode pypdf
你需要使用:
f = urllib.request.urlopen("some-url").read()
在上面的行之后添加这些行:
from StringIO import StringIO
f = StringIO(f)
然后使用 PdfReader 读取:
reader = PdfReader(f)
另外,请参考:Opening pdf urls with pyPdf
【讨论】: