【发布时间】:2017-09-10 03:01:11
【问题描述】:
我正在尝试从字符串中获取 RegExp 的所有匹配项,但显然它在 R 中并不那么容易,或者我忽略了一些东西。说实话,这真的很混乱,我发现自己迷失在所有选项中:str_extract、str_match、str_match_all、regexec、grep、gregexpr,谁知道还有多少其他选项。
实际上,我想要完成的只是(在 Python 中):
>>> import re
>>> re.findall(r'([\w\']+|[.,;:?!])', 'This is starting to get really, really annoying!!')
['This', 'is', 'starting', 'to', 'get', 'really', ',', 'really', 'annoying', '!', '!']
上面提到的函数的问题是要么返回一个匹配,要么根本不返回匹配。
【问题讨论】:
-
等等,是 Python 3 还是 Python 2?
\w有不同的默认行为。 -
它是 Python 3,但我试图找到问题的通用解决方案,不一定针对这个特定的正则表达式。
-
好的,我会在答案中添加更多内容。