【问题标题】:Find, delete and add text into pdf file in Python在 Python 中查找、删除文本并将其添加到 pdf 文件中
【发布时间】:2020-10-28 19:23:27
【问题描述】:

我有一个 pdf 文件,需要删除其中的某些文本。然后将下面的新文本添加到现有文本中。 我正在尝试使用PyMuPDF library - fitz。打开文件,设置要搜索的文本,但我没有找到如何删除它并添加新文本。 请你帮我如何删除找到的文本并添加到现有的文本中。 使用库并不重要,我们可以使用 PyPDF2 等。 带有描述的示例pdf文件是attached

import fitz
  
doc = fitz.open(MyFilePath)
page = doc[0]
  
text1 = “ANA”
text_instances1 = page.searchFor(text1)
  
# found text should be deleted …
  
text_to_add = “Text”
text2 = “TAIL NO.”
text_instances2 = page.searchFor(text2)
  
# should be added "text_to_add" after found text "text2"
  
doc.save(OutputFilePath, garbage=4, deflate=True, clean=True)

【问题讨论】:

  • 问题解决了吗?

标签: python python-3.x pdf


【解决方案1】:

该库不正式支持adding/deleting pdf 文档的文本。但是,根据记录的问题,有一个解决方法。您可以从库的作者那里看到答案here,了解如何使用Text Modification 方法解决这个问题。

我也担心这个库的文档似乎是unavailable。不确定这是否是永久性案例,但如果是这样,您应该考虑使用不同的库。您应该在最佳替代库上看到答案 - Add text to Existing PDF using Python

【讨论】:

  • 请注意,该解决方法明确地仅适用于以 ASCII 或拉丁文编码的文本。如果您最终获得任意输入文档,则即使文本仅使用 ASCII 范围内的字符,您也不能指望它。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2012-06-20
  • 2014-05-21
  • 1970-01-01
  • 1970-01-01
  • 2017-11-15
  • 2020-05-26
  • 1970-01-01
相关资源
最近更新 更多