【问题标题】:Repair apparently damaged pdf and reduce file size修复明显损坏的 pdf 并减小文件大小
【发布时间】:2012-06-15 15:21:00
【问题描述】:

我有一个 PDF 文件 (4.6MB),它是在 Ubuntu 12.04 中使用 pdftk 组合 6 个不同的 PDF(包含文本和位图图形)制作的。我希望在不影响其质量的情况下将此文件压缩到接近 2MB 的大小。

我尝试了 pdftk 的“压缩”选项(无法将其压缩到 2 MB),还尝试先将其转换为 ps,然后再转换为 pdf,它给出了以下警告:

****警告:将“0000000000 XXXXX n”视为免费条目。

然后挂起。 qpdf 也没有说文件已损坏。

有人可以帮我吗?

【问题讨论】:

  • 图形是矢量还是位图?如果您增加位图损失,您可能会获得一些压缩胜利 - 尽管我认为在生成时这样做会更好,而不是重新处理文件。
  • 哦,this 看起来会有帮助。
  • 我无法压缩 pdf 文件中的图形(顺便说一下,它是位图),因为我没有所有 pdf 的源文件。
  • 只是对您下一个问题的一点建议。提供详细信息(例如,您的图形是位图)和您尝试过的内容(例如 Multivalent)。这将为每个人节省时间!
  • 对于那些可能正在寻找这样的东西的人:以下两个答案都是正确的

标签: linux pdf compression pdftk


【解决方案1】:

Ghostscript 给你什么结果?试试这个命令:

gs \
  -o output.pdf \
  -sDEVICE=pdfwrite \
  -dPDFSETTINGS=/screen \
   input.pdf

【讨论】:

  • @Harsh Purwar:那么这个 Ghostscript 命令减少了多少 DID 文件大小?!?
  • @Harsh Purwar:如果无法查看+分析有问题的文件,就不可能给出更好的建议。可能根本不可能进一步减小文件大小。
  • @HarshPurwar - 我建议您通常更详细地回答,并使用诸如此类的答案作为起点进行更多研究。那么,GS 是否提供更改压缩比的选项?你能用更大的损失等重新编码位图吗?阅读手册,而不仅仅是说“它不起作用”:)
  • @HarshPurwar:gs 可以在编写 pdf 时对包含的位图进行下采样。检查手册。
  • 现在距离我的博士答辩还有 40 分钟,我的委员会开始告诉我他们无法打开我发送给他们的幻灯片。这个命令保存了一切。谢谢!
【解决方案2】:

这个pdf文件有保留信息吗?如果它没有机密数据,那会很有趣

无论如何,当 qpdf 失败时,Multivalent 工作

你可以尝试使用它的压缩工具(它也会尝试修复pdf文件)

多价

java -cp path....to/Multivalent.jar tool.pdf.Compress file.pdf

【讨论】:

  • 尝试使用 Multivalent 但它无法将我的文件压缩到超过 4.1 MB。虽然它表明:可以通过 -compact -jpeg -nopagepiece 进行额外的压缩 而且我不知道如何实现它。我尝试如下但失败了。 java -compact ./Multivalent.jar tool.pdf.Compress file.pdf
  • 正确的语法是(例如,假设您在 /root 中下载了 Multivalent.jarjava -cp /root/Multivalent.jar tool.pdf.Compress -jpeg -nopagepiece file.pdf
  • 现在它可以工作了,但仍然可以达到所需的文件大小。现在它被压缩到 4.0 MB。还有什么我可以尝试的吗?
  • 超出一定限度,pdf包含光栅图像,在不牺牲质量的情况下是不可能达到高压缩率的。您必须决定是否需要质量或更喜欢降级 pdf 的图像不用于打印,但只能在屏幕上查看。在我看来,带有低分辨率图像的 pdf 是没有用的,无论如何,您都需要一个高质量的备份副本,以免在必要时失去高质量打印文件的能力。如果 pdf 中的图像可以容忍 黑白 二值化,我可以修改答案以添加指令以使用 jbig2enc
【解决方案3】:

这对我来说可以修复损坏的 PDF

sudo apt-get install mupdf-tools
mutool clean input.pdf output.pdf

【讨论】:

    猜你喜欢
    • 2019-03-03
    • 1970-01-01
    • 1970-01-01
    • 2020-06-16
    • 2011-01-10
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-03-18
    相关资源
    最近更新 更多