【发布时间】:2016-05-03 01:12:51
【问题描述】:
我有一个这样的 XML 文件:
<TextBody>
<![CDATA[First line.&#10;Second line.]]>
</TextBody>
我需要使用R包提取CDATA中的信息,也就是说我想要
First line.\nSecond line.
所以我尝试了XML 包:
xmlParse("<TextBody><![CDATA[First line.&#10;Second line.]]></TextBody>",
replaceEntities=TRUE)
然后我被困在第一步,因为replaceEntities 选项在这里似乎不起作用,我仍然在解析的文本中得到&amp;#10;。
谁能告诉我如何从这个 XML 中提取正确的文本?
【问题讨论】: