【发布时间】:2012-04-27 13:53:04
【问题描述】:
我有很多 PDF 文件,其中一些非常大..
我有两个选择
- 移除图像并移除嵌入字体
- 压缩图片
是否可以删除 PDF 中的所有对象,如图像/字体(PHP 库或命令行工具)?
或者如果我想压缩 PDF 中的图像,你推荐哪个 PHP 库(或命令行工具)?
Debian/PHP
【问题讨论】:
我有很多 PDF 文件,其中一些非常大..
我有两个选择
是否可以删除 PDF 中的所有对象,如图像/字体(PHP 库或命令行工具)?
或者如果我想压缩 PDF 中的图像,你推荐哪个 PHP 库(或命令行工具)?
Debian/PHP
【问题讨论】:
pdftk 是 IMO 的必经之路。
它可以解压和压缩PDF的文本部分。此外,您可以在脚本中使用它来提取所有图像,使用其他工具对其进行压缩,然后将它们放回原始文档中。
我不确定它是否可以删除嵌入的字体。
HTH
【讨论】:
pdftk..找到了一种简单的方法来压缩pdf文件pdf2ps file.pdf output file.ps然后ps2pdf file.ps output new_file.pdf..你有一个链接如何提取图像然后用压缩的图像替换它们(pdftk)?
QPDF 可以提取图像,例如在Imagemagick: generate raw image data for PDF flate embedding? 看到这个答案,不确定替换,我也在寻找re-encoding only images of a PDF。干杯!
pdftk 实用程序不会对字体做任何事情,尽管将字体压缩为 CFF(也称为 Type 1C)并保留子集通常是缩小 PDF 文件的最佳方法,例如当使用pdflatex 获得 PDF 文件时。 ps2pdf 实用程序可以在字体上执行此操作,但要小心,因为它可能会损坏文本部分,而 Ghostscript 开发人员对此并不关心;见Ghostscript bug 704478。
很多工具,包括 Acrobat 都可以通过寻找优化来改善文件大小,例如
你看过这些工具吗?
【讨论】: