【发布时间】:2020-05-18 03:11:08
【问题描述】:
ms word 文档有多种样式的段落,通常每个段落都有一种样式,但您可以使用样式分隔工具在一个段落上组合两个或多个样式的文本。那么如何使用 Aspose Words、Apache Poi 或其他方法从根释义中获取子样式和样式分隔段落的文本内容?
【问题讨论】:
-
你试过什么?你被困在哪里了?这是关于
Office Open XML(*.docx) 还是二进制文件格式*.doc?至少在Office Open XML(*.docx) 中,样式分隔符只会导致段落的换行符消失。尽管如此,样式分隔符之前和之后的段落是两个单独的段落,可以这样阅读。 -
我在 docx 格式上尝试过 apache poi 和 aspose 解析器,但我只能获取根段落元素和样式。所以我是新的解析文档。
标签: java apache-poi apache-tika aspose aspose.words