【发布时间】:2019-07-11 17:32:46
【问题描述】:
我知道tfidf vectorizer 的公式是
Count of word/Total count * log(Number of documents / no.of documents where word is present)
我看到 scikit learn 中有 tfidf 转换器,我只是想区分它们。我找不到任何有用的东西。
【问题讨论】:
-
参考文档TfidfTransformer。它可能会帮助你
-
@AkshayNevrekar 这有点令人困惑。我无法理解使用的公式。我希望这里有人能提供帮助。
标签: python scikit-learn nltk tf-idf tfidfvectorizer