【发布时间】:2013-07-26 08:53:59
【问题描述】:
我想在一个字符串中查找所有空的HTML标签,例如:
<div></div>
<span>test</span>
<a></a>
并为该字符串中的所有空标签添加一个空格或一个字符:
<div>something</div>
<span>test</span>
<a>something</a>
我有一个匹配所有空标签的正则表达式,但我不确定替换标签的最佳方法是什么。
正则表达式:
<(\w+)(?:\s+\w+="[^"]+(?:"\$[^"]+"[^"]+)?")*>\s*</\1>
【问题讨论】:
-
提示:使用 HtmlAgilityPack(正则表达式是多余的)
-
regex is not overkill. it is "underkill" :) 使用 HTML/XML 解析器并在 DOM 树上进行交互 - 这将为您节省很多痛苦。
-
从我读到的内容来看,agilitypack 可能会弄乱 html 的其余部分,从而“修复”某些标签,例如 ..