【发布时间】:2013-09-11 23:22:11
【问题描述】:
我正在尝试拆分由多个空格分隔的字符串 即:
string1 = "abcd efgh a. abcd b efgh"
print re.findall(r"[\w.]+")
正如预期的那样,结果是:
['abcd', 'efgh', 'a.', 'abcd', 'b', 'efgh']
但是,我想将“a”分组。和“abcd”进入同一组,“b”和“efgh”进入同一组。所以我想要的结果看起来像:
['abcd', 'efgh', 'a. abcd', 'b efgh']
我目前的方法是创建两种类型的表达。第一个处理没有空格的正则表达式,即'abcd'和'efgh'。第二个处理具有单个空格的那些。即“一个” +'abcd'。
如果 r'[\w]+ 可以处理第一种类型,并且 r'[\w]+ [\w]+ 可以处理第二种。但我不知道如何使用 '|' 将它们组合成同一个表达式。
一如既往,欢迎任何其他方法。感谢您的宝贵时间!
【问题讨论】: