【发布时间】:2015-05-25 00:40:51
【问题描述】:
作为一些学校作业的一部分,我们设定的一项任务是使用 Python 中的正则表达式来搜索 nltk 单词语料库并找到所有仅包含元音的 3 个字母单词。 3 个字母的部分很简单,但我很难找到只包含元音的单词。我尝试了几种不同的方法都没有成功,我将在下面发布。如果有人能指出我做错了什么的正确方向,那就太好了。
import nltk
words = nltk.corpus.words.words('en')
threeLetterConsonants = [w for w in words if re.search('[aeiou]', w)]
threeLetterConsonants[:10]
返回
['a', 'aa', 'aal', 'aalii', 'aam', 'Aani', 'aardvark', 'aardwolf', 'Aaron', 'Aaronic']
我也试过了:
threeLetterConsonants = [w for w in words if re.search('[^bcdfghjklmnpqrstvwxyz]', w)]
threeLetterConsonants[:10]
返回
['A', 'a', 'aa', 'aal', 'aalii', 'aam', 'Aani', 'aardvark', 'aardwolf', 'Aaron']
【问题讨论】: