使用R语言从具有相同名称标签的XML中提取数据

【问题标题】：Extracting Data from XML With Same Name Tags using R language使用R语言从具有相同名称标签的XML中提取数据
【发布时间】：2019-03-18 05:48:34
【问题描述】：

提前致谢，我试图在 R 中解析一个 XML 文件，但是我卡住了，我将在下面解释我卡住的地方。

有几个标签名称，特别是有一个称为 ID 段标签的标签，其中将有多个 ID 名称，我必须在其中提取 ID 段中的第二个 ID。 XML1

【问题讨论】：

标签： r data-manipulation

【解决方案1】：

样本数据

没有给出示例数据，所以我自己创建了一个。

library(xml2)
doc = read_xml('<?xml version="1.0" ?><ID><IDSegment><IDNumber>ABC1234BD</IDNumber><IDNumber>ABCDEFG</IDNumber></IDSegment></ID>')

代码

#get all IDSegment_nodes
IDSegment.nodes <- xml_find_all( doc, ".//IDSegment")
#get the second IDNumber from each IDSegment-node.. NA if missing
xml_text( xml_find_first( IDSegment.nodes, ".//IDNumber[position() = 2]") )

输出

[1] "ABCDEFG"

【讨论】：