【发布时间】:2020-08-06 04:11:44
【问题描述】:
full_text = ''
i=0
while i<pdf_reader.getNumPages():
pageinfo = pdf_reader.getPage(i)
text += str(pageinfo.extractText())
print(pageinfo.extractText())
i = i + 1
我正在尝试从 PDF 文件中提取所有文本,我可以通过 for 循环提取所有文本。但是,我想将 for 循环保存为用于操作的变量。在我将 for 循环保存为 all_results 之后,之后我根本无法执行任何操作。例如,我尝试检查文本的长度,输出为 0。
【问题讨论】:
-
这是直接复制吗?我看到很多用于封装循环和 if 语句的空格。
-
你能编辑帖子并修复代码的缩进吗?
-
您不能将 for 循环保存为变量。如果你想重用for循环,你可以将它包装在一个函数中,稍后调用该函数
-
你确定问题不是因为代码的缩进?
-
@ParamSiddharth:这可能只是将代码复制到 Stack Overflow 的问题。希望 Kenny 将edit 问题显示正确的缩进,以便我们知道循环在哪里结束。但是“保存循环”的含义也不是很清楚。如果
all_results是字符串而i是整数,则all_results += i不可能工作。我不确定这是什么意思,真的。也许只是制作一个新的range对象?或者,如果您想保存文本,请将pageObj.extractText()的输出附加到列表中?