【发布时间】:2015-06-22 01:58:33
【问题描述】:
使用 Ruby 2.2
我有如下字符串:
- 每周二和周五
- 每周一、周三和周六
- 每月每两周的星期一
为了从上面显示的字符串中提取星期几,我编写了以下正则表达式:
/\b(Monday|Tuesday|Wednesday|Thursday|Friday|Saturday|Sunday)\b/
当尝试使用String#match 实例方法时,match_data 不会返回所有匹配项。例如请参考下面显示的 irb 输出,其中当字符串 Weekly on Tuesday and Friday 与上面显示的正则表达式匹配时,MatchData 仅包含 Tuesday。我希望它也包含Friday。
2.2.1 :001 > str = "Weekly on Tuesday and Friday"
=> "Weekly on Tuesday and Friday"
2.2.1 :002 > regex = /\b(Monday|Tuesday|Wednesday|Thursday|Friday|Saturday|Sunday)\b/
=> /\b(Monday|Tuesday|Wednesday|Thursday|Friday|Saturday|Sunday)\b/
2.2.1 :003 > str.match(regex)
=> #<MatchData "Tuesday" 1:"Tuesday">
2.2.1 :004 > match_data = str.match(regex)
=> #<MatchData "Tuesday" 1:"Tuesday">
2.2.1 :005 > match_data.captures
=> ["Tuesday"]
谁能解释我为什么在我的正则表达式中没有使用任何开始/结束锚点时 MatchData 只包含第一个匹配项?我确定我的正则表达式遗漏了一些东西,但我无法弄清楚。
注意
Rubular 显示相同正则表达式的正确匹配组,如 http://rubular.com/r/XZmrHPkjEk 所示
【问题讨论】:
-
您尝试过使用
str.scan(/\b(Monday|Tuesday|Wednesday|Thursday|Friday|Saturday|Sunday)\b/)吗?是你要找的吗? ruby-doc.com/docs/ProgrammingRuby/html/…. -
@stribizhev 是
str.scan(regex)返回所需的结果。但我需要了解为什么str.match(regex)没有返回所有匹配项。 -
因为不应该这样? Regexp#match 只返回正则表达式的匹配项。您的正则表达式只查找一周中的某一天,并因此匹配。
-
@ChrisHeald 在这种情况下,您能否在我的正则表达式中提出修复建议,以便它反复匹配字符串中存在的星期几。我尝试在我的正则表达式中使用重复量词,但似乎我在将它们与单词边界一起使用时犯了一些错误。
-
您无法从 Regexp#match 中获得任意数量的匹配组结果。您可以获得匹配多天的整个子字符串,但不能获取这些天的单个捕获。您需要为此使用#scan。