【发布时间】:2017-11-28 23:17:14
【问题描述】:
是否可以使用正则表达式来删除特定 HTML 块中的 HTML 标签?
例如
<body>
<p>Hello World!</p>
<table>
<tr>
<td>
<p>My First HTML Table</p>
</td>
</tr>
</table>
我不想删除所有 P 标记,只删除表格元素中的那些。
删除或保留嵌套 p 标记内的文本的能力将是理想的。
谢谢。
【问题讨论】:
-
在特定的 HTML 块内?当然。
s[<p>My First HTML Table</p>][My First HTML Table]— 但对于任何通用解决方案,请使用真正的 HTML 解析器。 -
我必须向您推荐任何涉及 HTML 和正则表达式的问题的规范答案:stackoverflow.com/questions/1732348/…
-
@Andrew - 当然是我最喜欢的答案 - 我猜是所有 SE 最喜欢的答案 :-)