【发布时间】:2020-07-05 02:27:06
【问题描述】:
我想将至少 2 个 PDF 文件合并为一个,同时保留原始 PDF 中的所有表单元素。表单元素包括文本字段、单选按钮、复选框、下拉菜单等。请查看带有表单的示例 PDF 文件:
http://foersom.com/net/HowTo/data/OoPdfFormExample.pdf
现在尝试将其与任何其他任意 PDF 文件合并。
你能做到吗?
编辑: 至于实现,我更喜欢在 linux 平台上使用开源工具(例如“ghostscript”)或您认为适合的任何其他工具的命令行解决方案解决这个问题。
当然,欢迎大家为这个问题提供任何可行的解决方案,包括涉及编写脚本的编码解决方案,该脚本对 pdf 处理库进行一些 API 调用。但是,我建议先走阻力最小的路径(CMD 解决方案)。
最好的问候
编辑#2:确实有几个 CMD 工具可以合并 PDF。但是,AFAIK,这些工具似乎无法保留原始 PDF 中的表单!这些工具似乎只是将所有这些 PDF 的打印输出连接成一个打印输出,然后以单个 PDF 的形式呈现。
此外,如果您将带有表格的 PDF 文件打印到文件中,您将丢失其中的所有表格。这显然不是我想要的。
【问题讨论】:
-
您想用哪种编程语言编写合并代码?您想使用哪个 pdf 库?
-
您好 mkl,感谢您抽出宝贵时间回复:D 我已经更新了原始问题以包含对首选技术实现的描述。
-
您好 Vitaliy Shibaev ,感谢您提出答案。不幸的是,我在写这个问题之前已经检查过的那个线程似乎只提供了将多个 PDF 的打印输出连接在一起的 CMD 解决方案。这样做会抵消这些文档中的所有活动表单,因为文本和复选框、下拉菜单和单选按钮会变成静态的——因此是无用的——图像。保留表单元素是这个问题与众不同的原因:)