【发布时间】:2013-01-06 11:55:06
【问题描述】:
我有一个字符串列表,这些字符串都是动词。我需要获取每个动词的词频,但我想将“want”、“wants”、“wanting”和“wanted”等动词计为一个动词。形式上,“动词”被定义为一组 4 个单词,其形式为 {X, Xs, Xed, Xing} 或形式为 {X, Xes, Xed, Xing},其中 X 是动词。我将如何从列表中提取动词,以便得到“X”并计算词干出现的次数?我想我可以以某种方式使用正则表达式,但是我是正则表达式的新手,我完全迷路了。
【问题讨论】:
-
您的意思是
{X, Xes, Xed, Xing}而不是{Xe, Xes, Xed, Xing}? -
@kafuka Windows 或 linux 都可以
标签: python regex string list nlp