【发布时间】:2016-07-13 05:28:44
【问题描述】:
我想在 Python 中匹配给定表达式之间出现的任何内容。例如:
dogdogacowadogdog <-- search a word between 'a' characters
<span>tiger<a> <-- search for sth between <span> and <a>
我想只匹配这个 something 之间的东西,所以它分别是 cow 和 tiger。但是,当使用 reexes 时:
r'a(.*)a'
r'<span>(.*)<a>'
它会打印整行,而不仅仅是我要查找的内容(与 (.*) 匹配的内容)。如何获取这些信息?
【问题讨论】:
-
听起来你想要
(.*?)(惰性匹配)。另外我希望你不是用正则表达式解析 HTML... -
你使用的是哪个
re函数? -
你必须使用捕获组。
-
@OrangeFlash81: match = re.search(regex, text)