【问题标题】:parsing a remote pdf file with Python3 & PyPDF2使用 Python3 和 PyPDF2 解析远程 pdf 文件
【发布时间】:2015-06-24 16:16:26
【问题描述】:

我需要解析一个远程 pdf 文件。使用 PyPDF2,它可以由 PdfReader(f) 完成,其中 f=urllib.request.urlopen("some-url").read() 。 PdfReader 无法使用 f,并且似乎必须对 f 进行解码。 decode() 中应该使用什么参数,或者必须使用其他方法。

【问题讨论】:

    标签: pdf python-3.x decode pypdf


    【解决方案1】:

    你需要使用:

    f = urllib.request.urlopen("some-url").read()
    

    在上面的行之后添加这些行:

    from StringIO import StringIO
    
    f = StringIO(f)
    

    然后使用 PdfReader 读取:

    reader = PdfReader(f)
    

    另外,请参考:Opening pdf urls with pyPdf

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-06-19
      • 1970-01-01
      • 2020-09-22
      • 1970-01-01
      • 2022-01-11
      相关资源
      最近更新 更多