【发布时间】:2013-04-11 06:38:04
【问题描述】:
我已经为scikit-learn 中的一些文档添加了CountVectorizer。我想在文本语料库中查看所有术语及其对应的频率,以便选择停用词。例如
'and' 123 times, 'to' 100 times, 'for' 90 times, ... and so on
这个有内置函数吗?
【问题讨论】:
标签: python machine-learning scikit-learn text-extraction countvectorizer