将 PDF 阅读函数结果保存到变量中答案

【问题标题】：Saving PDF reading function result to a variable将 PDF 阅读函数结果保存到变量中
【发布时间】：2018-11-24 21:12:39
【问题描述】：

我试图在应用时将函数的结果分配给一个变量，但是当我尝试打印分配的变量时，它显示为无。如何在函数之外保存和打印 page_contents？见以下代码：

def mpdf(pdf):
   pdfName = pdf
   read_pdf = PyPDF2.PdfFileReader(pdfName)
   for i in range(read_pdf.getNumPages()):
       page = read_pdf.getPage(i)
       print ('Page No - ' +    str(1+read_pdf.getPageNumber(page)))
       page_content = page.extractText()
       print ((page_content))
df=mpdf('sample.pdf')
print(df)
Output>>>None

【问题讨论】：

你从来没有return 来自mpdf...

标签： python python-3.x function nlp pypdf2

【解决方案1】：

你的函数必须return page_content

【讨论】：

【解决方案2】：

正如在其他地方提到的，您需要在函数内return

def mpdf(pdf):
   pdfName = pdf
   read_pdf = PyPDF2.PdfFileReader(pdfName)
   for i in range(read_pdf.getNumPages()):
       page = read_pdf.getPage(i)
       print ('Page No - ' +    str(1+read_pdf.getPageNumber(page)))
       page_content = page.extractText()
       print (page_content) # Do you need two parens?
       return page # or page_content
df=mpdf('sample.pdf')
print(df)

如果返回页面，则可以访问整个页面对象及其所有方法，而不是 extractText() 方法的结果。

【讨论】：

这确实有帮助，但如果我返回 page_content，我只会得到一页 pdf。我正在尝试获取整个文档。