【问题标题】:pdftk split pdf with multiple pages but total size grewpdftk 将 pdf 拆分为多页,但总大小增加
【发布时间】:2013-11-28 06:14:02
【问题描述】:

使用 php,我必须将其中包含多个页面的单个 pdf 文件拆分为每个文件一页的大量 PDF 文件。 我使用 pdftk 并且工作正常,但是为每个页面创建的每个 pdf 都非常大。我的原始PDF是7MB(里面有70页),每个用pdftk分割的文件总和超过70MB。

有人知道是否有一个属性可以设置为 pdftk 以输出小文件吗?

【问题讨论】:

  • 一个很好的解决方案是使用 cloudinary 来分割和检索像图像一样的 pdf 预览。cloudinary.com

标签: php pdf split pdftk


【解决方案1】:

您始终可以指定 compress 选项 - 例如:

pdftk input.pdf burst output output_%02d.pdf compress

请注意,pdftk 只是将您的 PDF 文件的内容从输入复制到输出,并不能做太多优化消除臃肿的工作。因此,如果您的输入 PDF 很大/很复杂,那么您的输出 PDF 也会如此。另请注意,文档中嵌入的任何字体最终可能会在每个输出文档中重复,占用更多空间。

【讨论】:

  • @Simone,正如 pobrelkey 所说,您可能在原始文件中有共同的资源,例如字体或背景图像,现在它们被复制了 70 次。也许单个页面示例将帮助某人提出优化方法。请注意,pdftk 不会压缩到最大值(使用 1.5 个功能,如压缩外部参照表和对象流,当然认为它不会提供 70 倍压缩)
  • 好的,我试试这个并解决了我的问题:pandemoniumillusion.wordpress.com/2008/05/07/…
【解决方案2】:

你可以用pdftk试试

pdftk source.pdf cat 1-100 output try1.pdf
pdftk source.pdf cat 101-end output try2.pdf

【讨论】:

    【解决方案3】:

    在拆分 PDF 文件时,有时很难避免每个输出文件中仅包含某些页面所需的信息。

    cpdf 努力避免这种情况——你可以试试看会发生什么。你可能会发现它在你的文件上并不比 pdftk 好,但它应该是。

    披露:我是 cpdf 的作者。

    【讨论】:

      【解决方案4】:

      遇到了类似的问题。但不适用于 1:1 的问题。无论如何,有人可能会觉得它很有用:

      1. 我有一个非常大的 pdf 文件 - original.pdf - 超过 240MB。它几乎是 不可能使用它。我用 evince 将它打印为 pdf 格式,然后 删除了打印机设置中的任何缩放。这生成了一个文件 - new.pdf - 大约102MB!显然所有嵌入的字体、书签等 被移除。
      2. 为了找回书签,我使用 cpdf 来提取 原始 pdf 文档中的书签并将其应用于 新的一个。生成的文档 - result.pdf - 易于浏览且输入速度非常快 任何 pdf 查看器。

      参考:cpdf 提取和应用书签:http://www.coherentpdf.com/cpdfmanual/node38.html

      cpdf -list-bookmarks original.pdf > booksmarks.txt
      cpdf -add-bookmarks booksmarks.txt new.pdf -o result.pdf
      

      【讨论】:

        【解决方案5】:

        我有同样的问题,我已经测试了两个程序 PdfTkcPDF 在这些答案中找到。

        我的 PDF 文件大小为 5744k。

        使用以下PDFTK 命令

        我得到一个 501k 文件。

        set pdftk="C:\Program Files (x86)\Tools\PDFtk\bin\pdftk.exe"
        %pdftk% "RY18BPSA.UserManual.pdf" CAT 1 9-15 220 output "RY18BPSA.PDFTK.pdf"
        

        使用以下CPDF 命令

        set cpdf="C:\Program Files\Tools\cpdf\cpdf.exe"
        %cpdf% "RY18BPSA.UserManual.pdf" 1,9-15,220 -o "RY18BPSA.CPDF.pdf"
        

        我得到一个 592k 的文件。


        只是为了好玩,我还测试了将所需页面直接打印到Microsoft to PDF 伪打印机,我已经获得了一个 250k 的文件!

        我可以快速看到与其他生成文件的唯一区别是页面格式已更改并替换为 A4 页面只能使用 PDF 程序的 Print GUI 手动完成,如 Acrobat阅读器或福昕阅读器。

        PS:我可以搜索所有生成的拆分文件!

        【讨论】:

          猜你喜欢
          • 1970-01-01
          • 2023-03-11
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 2021-12-08
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          相关资源
          最近更新 更多