【发布时间】:2010-09-26 06:27:51
【问题描述】:
我正在使用 re.findall() 从 HTML 文件中提取一些版本号:
>>> import re
>>> text = "<table><td><a href=\"url\">Test0.2.1.zip</a></td><td>Test0.2.1</td></table> Test0.2.1"
>>> re.findall("Test([\.0-9]*)", text)
['0.2.1.', '0.2.1', '0.2.1']
但我只想得到那些不以点结尾的。 文件名可能并不总是 .zip,所以我不能只将 .zip 粘贴在正则表达式中。
我想结束:
['0.2.1', '0.2.1']
谁能推荐一个更好的正则表达式来使用? :)
【问题讨论】: