【发布时间】:2016-09-29 07:09:23
【问题描述】:
我正在使用 Jsoup 1.9.2 来处理和清理特定标签的一些 XML 输入。在此期间,我注意到 Jsoup 在被要求清理 title 标记时表现异常。具体来说,title 标记中的其他 XML 标记不会被删除,实际上会被它们的转义形式替换。
我为此创建了一个简短的单元测试,如下所示。测试失败,因为output 的值是CuCl<sub>2</sub>。
@Test
public void stripXmlSubInTitle() {
final String input = "<title>CuCl<sub>2</sub></title>";
final String output = Jsoup.clean(input, Whitelist.none());
assertEquals("CuCl2", output);
}
如果title 标记被替换为其他标记(例如,p 或 div),则一切正常。任何解释和解决方法将不胜感激。
【问题讨论】: