【问题标题】:Extract Data from ODT to PDF in Java用Java从ODT中提取数据到PDF
【发布时间】:2014-04-22 07:00:58
【问题描述】:

我想在java中获取ODT文件的数据。为此,我有两种方法。

1)。我从 ODT 文件中提取数据并创建一个新文档

2)。获取 odt 文档的打印预览并将其作为图像添加到 PDF 文档中,例如 this

您能否建议哪种方法更好,我应该怎么做?

【问题讨论】:

    标签: java pdf data-extraction odt


    【解决方案1】:

    最后我使用了第三种方法。在寻找我的答案时,我偶然发现了一个用于我的目的的 JAVA 库 XdocReport 。我在那里使用 ODT 和 DOCX 转换器将 ODT/DOCX 转换为 PDF 格式。

    【讨论】:

      【解决方案2】:

      对于提取: 1)您可以使用纯Java,解压缩文件并处理(大部分) content.xml 文件。 2) 您可以使用 LibreOffice Java SDK 来创建通往 LibreOffice 的桥梁并以编程方式提取文本。 SDK 中有执行此操作的示例代码。

      对于转换: 1)您可以从命令行执行此操作(再次使用 Libre Office): soffice——转换为pdf 2) 您可以使用 SDK 以编程方式驱动它,如上面的 #2。有一个博客Converting Documents to PDF我写了一段时间,它展示了一个专注于Doc输入的例子(但ODT是一样的)。

      这取决于您想要执行的频率、性能限制等。

      【讨论】:

      • 嘿@Paul Jowett,我在你的博客之后构建了一些关于将 doc 转换为 pdf 的代码,但我有一个问题,我想知道你是否可以看看 stackoverflow.com/questions/55621825,我将不胜感激
      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-11-25
      • 1970-01-01
      • 1970-01-01
      • 2022-01-18
      相关资源
      最近更新 更多