【发布时间】:2009-03-04 01:23:48
【问题描述】:
我需要从一组 HTML 文件中找到某个块并将其全部删除。这些文件实际上是被 HTML 破解的,所以我不想像以前那样用 HtmlAgility 包解析它,而是想使用一个简单的正则表达式。
html 部分将始终如下所示:
<CENTER>some constant text <img src=image.jpg> more constant text:
variable section of text</CENTER>
以上都可以是大小写任意组合,注意是img src=image.jpg而不是img src="image.jpg"...而且可以有任意数量的空格常量字符之间的字符。
这里有一些例子:
<CENTER>This page has been visited
<IMG SRC=http://place.com/image.gif ALT="alt text">times since 10th July 2007
</CENTER>
或
<center>This page has been visited
<IMG src="http://place.com/image.gif" Alt="Alt Text">
times since 1st October 2005</center>
你认为匹配这种模式的好方法是什么?
【问题讨论】: