【发布时间】:2008-10-24 10:14:00
【问题描述】:
所以我有大量的 PDF 文件需要从中提取文本。
这些文件是加密的,但我知道它们的密码。我正在寻找一种方法来自动化提取文本的过程。
我可以在 Acrobat Professional 中手动打开文件,通过输入密码删除安全性,然后另存为 .txt 文件。但是,无法通过批处理 600 个文件来自动执行此操作。
我正在寻找一些工具来帮助解决这个问题。我对 Perl 很好,所以我尝试了 CPAN 的各种 PDF 处理模块,但它们无法读取加密的文档。任何人对此有任何解决方案?
【问题讨论】:
标签: pdf text encryption