【发布时间】:2014-04-22 07:00:58
【问题描述】:
我想在java中获取ODT文件的数据。为此,我有两种方法。
1)。我从 ODT 文件中提取数据并创建一个新文档
2)。获取 odt 文档的打印预览并将其作为图像添加到 PDF 文档中,例如 this
您能否建议哪种方法更好,我应该怎么做?
【问题讨论】:
标签: java pdf data-extraction odt
我想在java中获取ODT文件的数据。为此,我有两种方法。
1)。我从 ODT 文件中提取数据并创建一个新文档
2)。获取 odt 文档的打印预览并将其作为图像添加到 PDF 文档中,例如 this
您能否建议哪种方法更好,我应该怎么做?
【问题讨论】:
标签: java pdf data-extraction odt
最后我使用了第三种方法。在寻找我的答案时,我偶然发现了一个用于我的目的的 JAVA 库 XdocReport 。我在那里使用 ODT 和 DOCX 转换器将 ODT/DOCX 转换为 PDF 格式。
【讨论】:
对于提取: 1)您可以使用纯Java,解压缩文件并处理(大部分) content.xml 文件。 2) 您可以使用 LibreOffice Java SDK 来创建通往 LibreOffice 的桥梁并以编程方式提取文本。 SDK 中有执行此操作的示例代码。
对于转换: 1)您可以从命令行执行此操作(再次使用 Libre Office): soffice——转换为pdf 2) 您可以使用 SDK 以编程方式驱动它,如上面的 #2。有一个博客Converting Documents to PDF我写了一段时间,它展示了一个专注于Doc输入的例子(但ODT是一样的)。
这取决于您想要执行的频率、性能限制等。
【讨论】: