【发布时间】:2011-09-07 09:28:08
【问题描述】:
我正在使用 XmlReader 来遍历一些 XML。一些 XML 实际上是 HTML,我想从节点获取文本内容。
示例 XML:
<?xml version="1.0" encoding="UTF-8"?>
<data>
<p>Here is some <b>data</b></p>
</data>
示例代码:
using (XmlReader reader = new XmlReader(myUrl))
{
while (reader.Read())
{
if (reader.Name == "p")
{
// I want to get all the TEXT contents from the this node
myVar = reader.Value;
}
}
}
这并没有让我得到所有的内容。如何从
中获取所有内容节点在那种情况下?
【问题讨论】:
-
示例 XML 无效。 HTML 是否正确编码?
-
我的印象是 XML 不应该在包含节点的元素中包含文本。它应该是一个属性,或者作为一个子节点的内部文本。
-
@Tejs 好的,但这完全合法。
-
@Tejs 是合法的。它在 XML 中称为“混合内容”。 w3schools.com/schema/schema_complex_mixed.asp