【问题标题】:Saving PDF reading function result to a variable将 PDF 阅读函数结果保存到变量中
【发布时间】:2018-11-24 21:12:39
【问题描述】:

我试图在应用时将函数的结果分配给一个变量,但是当我尝试打印分配的变量时,它显示为无。如何在函数之外保存和打印 page_contents?见以下代码:

def mpdf(pdf):
   pdfName = pdf
   read_pdf = PyPDF2.PdfFileReader(pdfName)
   for i in range(read_pdf.getNumPages()):
       page = read_pdf.getPage(i)
       print ('Page No - ' +    str(1+read_pdf.getPageNumber(page)))
       page_content = page.extractText()
       print ((page_content))
df=mpdf('sample.pdf')
print(df)
Output>>>None

【问题讨论】:

  • 你从来没有return 来自mpdf...

标签: python python-3.x function nlp pypdf2


【解决方案1】:

你的函数必须return page_content

【讨论】:

    【解决方案2】:

    正如在其他地方提到的,您需要在函数内return

    def mpdf(pdf):
       pdfName = pdf
       read_pdf = PyPDF2.PdfFileReader(pdfName)
       for i in range(read_pdf.getNumPages()):
           page = read_pdf.getPage(i)
           print ('Page No - ' +    str(1+read_pdf.getPageNumber(page)))
           page_content = page.extractText()
           print (page_content) # Do you need two parens?
           return page # or page_content
    df=mpdf('sample.pdf')
    print(df)
    

    如果返回页面,则可以访问整个页面对象及其所有方法,而不是 extractText() 方法的结果。

    【讨论】:

    • 这确实有帮助,但如果我返回 page_content,我只会得到一页 pdf。我正在尝试获取整个文档。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-05-25
    • 2023-03-06
    • 1970-01-01
    • 2021-03-07
    • 1970-01-01
    • 2017-05-12
    相关资源
    最近更新 更多