【发布时间】:2011-10-27 19:26:32
【问题描述】:
我正在使用 Jsoup 尝试清理文档中几乎所有的 html,但将带有 特定类的 span 标签列入白名单。
我有这个,但显然这结束了允许所有具有 attr 类的跨度
String html = "<p><strong>Lorem ipsum dolor<br /> sit amet</strong></p>"+
"<span class=\"killme\">Aenean</span> quam sem" +
"<span class=\"whitelistme\">lacinia molestie</span> nibh mattis ";
String clean = Jsoup.clean(html,
Whitelist.none()
.addTags("span")
.addAttributes("span", "class"));
有没有办法清理除 之外的所有 html ?
所以我的最终结果将是
Lorem ipsum dolor sit amet
Aenean quam sem
<span class="whitelistme">lacinia molestie</span> nibh mattis
【问题讨论】: