【发布时间】:2014-01-22 10:33:36
【问题描述】:
我们如何在终端中使用 vim 命令读取 pdf 文件的内容? 我曾尝试通过解压缩来使用 pdftk,但它仍然不适合我。有没有其他方法可以解密或解码 pdf,以便我们可以使用 vim 在任何 Linux 风格的终端上阅读。
【问题讨论】:
-
在vim的官网上,vim的定义很明确:
vim the editor不是pdf阅读器,也不是MS-Word阅读器。您当然可以用其他语言编写 pdf 阅读器,例如带有 itext 库的 Java。并在 vim 中调用该工具。但这不是使用 vim 的正确方法。我的 2 美分。 -
@Kent 但看到我们可以使用 vim 打开任何东西,但主要是我们无法读取它,因为它是加密格式的。所以我的兴趣是解码它,这样我们就可以在使用vim时理解pdf的内容。最主要的是它在解密时不应该丢失任何东西。如果您想了解我的更多问题,请访问此pdflabs.com/docs/pdftk-cli-examples 有一种解压缩方法,根据此命令,我们可以使用 vim 或 emacs 读取 pdf。
-
pdftk(或 qpdf 或 cpdf,也可以解压缩内容流等)不会 asciify(即
ASCII85Encode)二进制流,如图像、字体等。不幸的是。因此,大多数PDF文件解压后仍然包含二进制数据,不适合文本编辑器。也许你想看看 COS 结构的编辑器/浏览器(PoDoFo 浏览器、Enfocus PDF 浏览器、iText RUPS(它们都是免费的)等)。 -
内容流中的字符串文字也可以是二进制的。
-
可能跑题了,但
less可以阅读 PDF。less file.pdf.