【发布时间】:2012-08-12 17:05:11
【问题描述】:
我目前编写了一个 nooby 正则表达式模式,其中涉及过度使用“(”和“)”字符,但我将它们用于“或”运算符,例如 (A|B|C) 表示 A或 B 或 C。
我需要在字符串中找到模式的每个匹配项。
尝试使用 re.findall(pattern, text) 方法并不好,因为它将括号字符解释为索引符号(或任何正确的行话),因此生成的 List 的每个元素都不是显示匹配文本部分的字符串,而是是一个元组(其中包含非常丑陋的模式匹配的 sn-ps)。
我是否可以将参数传递给 findall 以忽略括号作为索引?
还是我必须使用re.search和re.sub的非常丑陋的组合
(这是我能想到的唯一解决方案;找到 re.search 的索引,将匹配的文本部分添加到列表中,然后将其从原始字符串中删除{通过使用丑陋的索引技巧},继续此操作直到没有更多的匹配项了。显然,这是可怕的和不可取的)。
谢谢!
【问题讨论】:
-
您能否向我们展示您尝试匹配/捕获的样本和不匹配的样本?
-
可能你的正则表达式可以改进 =)
-
例如,
re.findall(r"(A|B|C)D", "BDE")返回 ['B'] 而不是 ['AD']