【发布时间】:2022-01-21 22:44:27
【问题描述】:
我有一个 txt 文档,我使用 pdfminer 从 PDF 转换而来。它有一个摘要部分,通常是 PDF 格式的一页。问题是我可以毫无问题地找到总结这个词:
with open('output.txt',encoding="utf-8") as f:
if 'Summarization' in f.read():
print("true")
但我坚持这一点。在段落完成之前,我不知道如何阅读。
该段落在 PDF 中如下所示: PDF Summ Part
它在 txt 中看起来像这样:我已经创建了它:TXT Summ Part
如果我能得到任何帮助,我会很高兴。谢谢。
【问题讨论】:
-
只读到像this这样的完整空行