【发布时间】:2011-03-12 16:52:21
【问题描述】:
我有一种情况,我想将用户提供的单页 PDF 转换为合适的高分辨率的黑白位图,以便进一步处理(最终以专有的打印解决方案结束)。所有这些都必须在无头模式下运行。
由于政治和技术原因,这必须是一个纯 Java 库(即没有 Ghostscript 包装器),此时我们对免版税的开源解决方案感兴趣,但性能不是很重要。如果这个项目成功,我们可能需要升级到更高性能的专有库,但现在不是。
我环顾四周,发现大多数 PDF 库项目都专注于处理或查看 PDF,但不像渲染引擎那样使用它——这是我唯一需要的东西——而且至少有一个与商业版本相比,开源版本的字体引擎故意削弱了字体引擎。
因此,我需要推荐一个 PDF 库:
- 以无头模式将输入文件渲染为位图。
- 全 Java,无本机代码。
- 呈现所有常见的 PDF 文件(无效或格式不正确的文件除外)
- 是具有商业友好许可证的开源软件。
- 很健壮
- 积极维护
- 可能会很慢或无法处理超过几页(商业版本中取消了更多页面的限制)
建议?
【问题讨论】:
-
请不要只提及可以进入 cmets 的项目。
-
@Thorbjørn Ravn Andersen - 我自己也对此深思熟虑并删除了我的帖子。 T
-
一个选项是 [apache PDFBox][pdfbox.apache.org/] 和示例 [这里][kickjava.com/src/org/pdfbox/PDFToImage.java.htm]。
-
您对您提到的软件包有实际经验,并亲身了解它们可以满足我的需求吗?
-
我只将它用于文本提取,它对我的目的来说工作得很好。但不幸的是,无论如何都不是其内部细节的专家。
标签: java pdf pdf-rendering