【问题标题】:How to parse texts outside XML tag?如何解析 XML 标签外的文本?
【发布时间】:2019-12-06 18:26:13
【问题描述】:

我想解析出现在 XML 文件中但在 XML 标记之外的文本。在附加的示例中,我只想解析p 标签之外的文本,例如"FIELD OF THE TECHNOLOGY""DETAILED DESCRIPTION OF THE TECHNOLOGY"

我的 XML 文件的一个例子是:

<description>                        
FIELD OF THE TECHNOLOGY
<p>The present technology is directed ....</p>
<p>The present invention is.....</p>
<p>One promising approach has ...,</p>


DETAILED DESCRIPTION OF THE TECHNOLOGY
<p>The present tech provides, ....</p>
<p>A report by Kearse et al.,...</p>
</description>

【问题讨论】:

  • 感谢您的评论。

标签: java xml xml-parsing


【解决方案1】:

术语

在您的示例中,description 元素具有混合内容。您正在寻找提取description 元素的文本节点 子元素。确定正确的术语是寻找答案(并缩小过于宽泛的问题)的第一步。

解析 XML

...一般使用 Java

...混合内容:

...选择解析技术:

您可以在 choosing a parsing technology 上找到许多教程,但 XPath 特别适合选择 XML 文档的一部分,并且有适用于大多数语言的库。

...通过 XPath,例如:

这个 XPath,

//description/text()

将从description 元素中选择所有直接文本节点子节点。根据要求,它将不包括p 元素或其后代。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2018-09-30
    • 2015-11-29
    • 1970-01-01
    • 2011-10-15
    • 2013-07-02
    • 1970-01-01
    • 2012-11-10
    • 1970-01-01
    相关资源
    最近更新 更多