使用 标签混合实体会导致 XML 解析器异常答案

【问题标题】：Mixing entities with tag causes XML parser exception使用 标签混合实体会导致 XML 解析器异常
【发布时间】：2012-02-14 15:02:51
【问题描述】：

我使用 Java 和 Apache Xerces XML 解析器。错误发生在org.apache.xerces.parsers.DOMParser.parse内部。

<content id="xxx">&amp;<br /></content>

如果我要解析的 XML 文档中出现这样的行，解析器会崩溃并返回以下错误消息：

org.xml.sax.SAXParseException: The entity name must immediately follow the '&' in the entity reference.

我可以将问题的根源缩小到  的出现，因为如果我忽略它但无法理解导致损坏的原因，它会很好地工作。 & 符号已正确转义，不应以任何方式干扰   作为 HTML 行分隔符的出现。

【问题讨论】：

【解决方案1】：

你可以像这样把它放在!CDATA下面。如果这是您所追求的，这将使它不会被 XML 解析器解析。您可以阅读有关 CDATA 部分的更多信息here。

<content id="xxx">&amp;<![CDATA[ ]]/>

【讨论】：

【解决方案2】：

您应该在 CDATA 中的标签之间放置文本：

<content id="xxx"><![CDATA[&amp; <br />]]></content>

或者这样写：

<content id="xxx">&amp; &lt;br /&gt;</content>

【讨论】：