【发布时间】:2011-12-01 05:05:29
【问题描述】:
好的,这听起来可能有点复杂,但相信我不应该这样。
我需要做的是找到一个可以是任何值的字符串,它位于">" 和"</" 之间,最小长度为 5,最大长度为 7,并且正好包含 2 个点。
如果我有这样的文本文件:
<a href="www.site.com">a site</a>
text<br />
More test<br />
<img src="maybe an images">
<h2>5.0.77</h2></br>
More text<br />
我希望它只找到 5.0.77。不,数字并不总是在h2 标签之间,而且数字甚至不总是相同的。唯一不变的是它介于 ">" 和 "</" 之间,并且它介于 5 到 7 个字符之间,并且包含 2 个点。
如果有人能提供帮助,我将不胜感激。
【问题讨论】:
-
这个应该有作业标签吗?
-
不要认为老师足够聪明会问这样的问题;-)
-
为什么是 random 标签——你是想生成这样的字符串,还是找到它们?另一件事——if you are using RE to parse HTML, you are barking up the wrong tree.