【发布时间】:2020-05-13 22:38:40
【问题描述】:
在上面的例子中,tfidf 是为训练和测试语料分别生成的。它不应该一起生成吗,因为单独处理训练和测试与一起处理时 idf 会不一样?谢谢。
# Vectorize the training data
X_train = vectorizer.fit_transform(train_corpus)
# Vectorize the testing data
X_test = vectorizer.transform(test_corpus)
【问题讨论】:
标签: scikit-learn classification tf-idf