【发布时间】:2011-07-21 04:08:09
【问题描述】:
我想将直接作为子节点出现的所有文本元素提取到根节点。我使用DefaultHandler 浏览了java 标准萨克斯风。但它似乎不是 path 感知的。
问题是获取first-level only 节点,而不是extracting only text-nodes。
是否有任何非面向 DOM 的方法来做到这一点? (注意,节点名称事先不知道)
[编辑]
示例输入
<root>
<a>text1</a>
<b>text2</b>
<c>text3</c>
<nested>
<d>not_text4</d>
...
<nested>
...
</root>
样本输出
Map<String, String> map := {
{a, text1}
{b, text2}
{c, text3}
}
目前已解决为面向 DOM 的解决方法。尽管存在为 SAX / STAX 提供 xpath 表达式子集的库。
【问题讨论】:
-
如果您添加一些示例输入 xml 和预期结果,我们可以更好地帮助您。
-
@Don Roby,当然。问题已更新
标签: java dom sax xml-parsing stax