【发布时间】:2014-06-24 22:47:07
【问题描述】:
我正在尝试从 python 中的字符串中提取单词 taller 和 shorter 的词干。
我做了以下事情:
>>> from nltk.stem.porter import *
>>> print(stemmer.stem('shorter'))
shorter
>>> print(stemmer.stem('taller'))
taller
由于某种原因,我没有看到 tall 和 short 这两个词。任何人都知道如何解决这个问题,或者可能指导替代解决方案?
【问题讨论】: