【问题标题】:Python reading starting from a certain word until that paragraph finishesPython 从某个单词开始阅读,直到该段落结束
【发布时间】:2022-01-21 22:44:27
【问题描述】:

我有一个 txt 文档,我使用 pdfminer 从 PDF 转换而来。它有一个摘要部分,通常是 PDF 格式的一页。问题是我可以毫无问题地找到总结这个词:

with open('output.txt',encoding="utf-8") as f:
if 'Summarization' in f.read():
    print("true")

但我坚持这一点。在段落完成之前,我不知道如何阅读。

该段落在 PDF 中如下所示: PDF Summ Part

它在 txt 中看起来像这样:我已经创建了它:TXT Summ Part

如果我能得到任何帮助,我会很高兴。谢谢。

【问题讨论】:

  • 只读到像this这样的完整空行

标签: python pdf txt pdfminer


【解决方案1】:

你可以读到空行:

with open('output.txt',encoding="utf-8") as f:
if 'Summarization' in f.read():
    print("true")
if f.read().strip() == '':
    print('It's new paragraph')

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-03-04
    • 2013-10-06
    • 2011-07-02
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多