【发布时间】:2012-05-24 12:19:51
【问题描述】:
有没有办法从 pdf 文件中删除多次嵌入的字体?
这是我的场景:
1) 一个程序生成几个单页的 pdf 报告(查询数据库,将信息放在 excel 模板上,并将格式化的信息导出为 pdf)
2) pdftk 将单页 pdf 合并到一个文件中。
一切正常,但是生成的 pdf 的大小非常大:事实上,我注意到字体被嵌入了多次(与页数一样多次:所有页面都是从同一个 excel 开始生成的模板,字体嵌入在单个 pdf 文件中,pdftk 只是粘合 pdf)。有没有办法只保留每个嵌入字体的一个副本?
我尝试在从 excel->pdf 导出时仅在第一页嵌入字体:文件大小显着减小,但其他页面似乎无法访问嵌入的字体。
谢谢, 亚历山德罗
【问题讨论】:
-
您能否提供 2-3 个单页 PDF 示例? (如果原始数据太敏感,也许使用虚拟数据?)
-
您能否为一些输入文件添加
pdffonts input.pdf的输出,以及为pdftk从同一组输入创建的文件添加pdffonts output.pdf? -
对不起,我没有在这里看到你的 cmets。我在下面写了如何使用虚拟单词文件重现我的问题。是否可以通过某种方式上传文件?我会尽快下载我电脑上没有安装的 pdffonts,我会告诉你的。
-
我在dropbox.com/sh/l3nmw23ycfs2s8e/W5bdqjXOik上传了我的虚拟示例文件
标签: excel pdf ghostscript embedded-fonts pdftk