【发布时间】:2013-08-14 21:25:03
【问题描述】:
在我的 SVM 中,我在文档上使用 tf-idf 进行特征提取。这些 tf-idf 是在整个训练文档上计算出来的。
现在当我得到一个我想要分类的测试文档时,我如何为它生成向量?
我在计算 tf-idf 之前使用了词干提取。我也可以在测试文档上执行该操作。我有 count_of_words 用于火车文件。
我应该增加训练文档 count_of_words 中的单词计数来计算测试文档的 tf-idf 还是应该直接使用它?
【问题讨论】:
标签: machine-learning svm feature-extraction tf-idf feature-selection