【发布时间】:2018-09-29 09:12:50
【问题描述】:
我是 python 的新手,正在练习书中的示例。 我能干一个字:
>>> from nltk.stem import PorterStemmer
>>> stemmer=PorterStemmer()
>>> stemmer.stem('programming')
'program'
但我无法通过 Porter 词干分析器运行文本文件的前 50 个单词。
编辑:除了 split() 之外还有其他方法吗? split() 有时会给出错误的结果。
【问题讨论】:
-
for word in open('/path/to/file').read().split()[:50]: print(stemmer.stem(word)) -
*注意 file.read().split() 假定标记化 ;P
标签: python nltk porter-stemmer