【发布时间】:2014-12-17 04:56:02
【问题描述】:
我正在从如下所示的 xml 文件结构中解析数据:
<Filegram Status="Idle" Version="3.0.0.12">
<CXDVideo>
<ArrayOfDouble xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema">
<double>0.074345000088214874</double>
<double>0.081780999898910522</double>
<double>0.089218996465206146</double>
<double>0.0966539978981018</double>
<double>0.10408999770879746</double>
<double>0.1115259975194931</double>
<double>0.11896199733018875</double>
</ArrayOfDouble>
</CXDVideo>
</Filegram>
使用doc1 <- xmlParse() 导入xml 文件后,我尝试使用以下命令提取数字:
xpathSApply(doc1, "//Video/ArrayOfDouble", xmlValue)
我将所有值作为单个字符获取:
[[1]]
[1] "00.00623949430882930760.0132457073777914050.0202680919319391250.0306097287684679030.0346436910331249240.0412975363433361050.0483214072883129120.0553476661443710330.0623622909188270570.0693683102726936340.0763849914073944090.083491444587707520.0904
使用 xmlToDataFrame 或 xmlToList 可以很好地解析此部分,但速度很慢。我希望使用 xpathSApply 加快数据提取过程,但无法正常工作。
【问题讨论】:
标签: xml r xml-parsing