【发布时间】:2019-03-18 05:48:34
【问题描述】:
提前致谢, 我试图在 R 中解析一个 XML 文件,但是我卡住了,我将在下面解释我卡住的地方。
有几个标签名称,特别是有一个称为 ID 段标签的标签,其中将有多个 ID 名称,我必须在其中提取 ID 段中的第二个 ID。 XML1
【问题讨论】:
标签: r data-manipulation
提前致谢, 我试图在 R 中解析一个 XML 文件,但是我卡住了,我将在下面解释我卡住的地方。
有几个标签名称,特别是有一个称为 ID 段标签的标签,其中将有多个 ID 名称,我必须在其中提取 ID 段中的第二个 ID。 XML1
【问题讨论】:
标签: r data-manipulation
样本数据
没有给出示例数据,所以我自己创建了一个。
library(xml2)
doc = read_xml('<?xml version="1.0" ?><ID><IDSegment><IDNumber>ABC1234BD</IDNumber><IDNumber>ABCDEFG</IDNumber></IDSegment></ID>')
代码
#get all IDSegment_nodes
IDSegment.nodes <- xml_find_all( doc, ".//IDSegment")
#get the second IDNumber from each IDSegment-node.. NA if missing
xml_text( xml_find_first( IDSegment.nodes, ".//IDNumber[position() = 2]") )
输出
[1] "ABCDEFG"
【讨论】: