【问题标题】:Creating Docx, PDF, XSL-FO创建 Docx、PDF、XSL-FO
【发布时间】:2014-05-07 16:15:00
【问题描述】:

[背景信息]

我们有一个解决方案来使用 Word 自动化服务器端将 HTM 文档转换为 Docx、PDF 或打印文档。此解决方案在最新版本的 Windows Server 2012 中出现问题。我们了解到 MS 不打算让 Word 以这种方式工作,在与 MS 支持工程师一起解决问题后,我们得出结论,它永远不会工作。

[目前]

我目前正在研究我的公司可以用来恢复此功能的潜在技术和工具。我们需要能够创建 Docx、PDF 并将文件打印到本地打印机。

我已经研究了一些工具,目前我倾向于使用 Apache FOP,这似乎可以为我们处理 PDF 和打印。

但是,我正在寻找一些建议和建议的工具,我们可以使用它们来实现纯 Java 方法。目前,我们的应用程序会创建包含所有必需信息的 HTM 文件。因此,理想情况下,我们希望将这些 HTM 文件“转换”为 Docx/XLS-FO 格式。

[问题]

所以我希望你能帮助我解决我的问题。 我可以使用的最佳工具是什么

  1. HTM 转 Docx
  2. HTM 转 PDF

或者实现这一目标的最佳过程是什么?过去有没有人成功找到解决方案?

谢谢

【问题讨论】:

    标签: java xml xslt pdf ms-office


    【解决方案1】:

    这取决于控制级别和源 HTML 的复杂性。有HTML to FO stylesheets,但您可能会发现他们想要满足您的特定需求。

    因此您可以使用Jericho 解析器来读取 HTML 并生成 FO。或者你直接使用 Apache PDFBox 和Apache POI生成目标格式

    这一切都归结为您想要/需要的控制水平

    【讨论】:

      【解决方案2】:

      docx4j-ImportXHTML 将把你从 XHTML 带到 docx。从那里,您可以使用 docx4j(或其他一些解决方案,例如 LibreOffice/OpenOffice)将 docx 转换为 PDF。

      docx4j 支持 docx 转 XSL FO,默认使用 FOP。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 2016-11-21
        • 1970-01-01
        • 2017-11-21
        • 2011-11-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多