【发布时间】:2012-12-16 22:44:24
【问题描述】:
可能重复:
How to remove HTML tag in Java
RegEx match open tags except XHTML self-contained tags
我想删除特定的 HTML 标记及其内容。
例如,如果 html 是:
<span style='font-family:Verdana;mso-bidi-font-family:
"Times New Roman";display:none;mso-hide:all'>contents</span>
如果标签包含“mso-*”,则必须删除整个标签(开始、结束和内容)。
【问题讨论】:
-
就个人而言,我会使用 HTML 解析器。
-
这类问题在这里不是被问过很多次了吗?