【发布时间】:2019-02-20 03:36:52
【问题描述】:
我有隐藏部分 pdf 的代码(只用白色多边形覆盖它)但问题是,文本仍然 那里,如果你 ctrl-f 你仍然可以找到它。
我的目标是实际从 pdf 本身中删除文本。使用 pdfminer 我设法从 pdf 中提取文本,但我不知道是否可以用一些空格来实际“替换”文本。使用python可以做到这一点吗?提取它是不够的。我需要从 PDF 中删除文本
【问题讨论】:
-
用具体的工具,当然是可以的!看看我在谷歌上找到的这个链接...binpress.com/manipulate-pdf-python
-
引用@Ryan 已删除的答案(省略广告部分):是的,这通常称为编辑,涉及从 PDF 文件中完全删除文本/图形。 PDF的编校不是小事,所以不知道有没有免费的Python编校工具。
-
老实说,伙计们,最终,在通过 Python 尝试了不同的方法 5 小时之后。我意识到更聪明的做法是使用 Adobe 来编辑文本。我感谢提供赏金的人,但我已经过了实际检查这些新解决方案是否可行的地步。
-
嗨,@Wallace,您能否分享您如何使用 adobe redact 以编程方式实现目标的任何参考资料?
-
嘿,很抱歉这么长的回复,这是大约一年前的事情,所以我没有任何参考资料。但是 Adobe(高级版)有一项功能,可以在文档的每一页上的一个位置编辑给定的文本,我使用了该功能。我实际上忘记了我使用的 adobe 软件的确切名称,因为它在另一台笔记本电脑上。对不起。
标签: python python-3.x pdf