【发布时间】:2019-12-09 21:40:55
【问题描述】:
我在网上看到了各种文章,其中一些建议 CountVectorizer 应该适合训练集和测试集,还有一些建议它应该只适合训练集。 哪种方法通常更适合文本分类?
【问题讨论】:
标签: python python-3.x scikit-learn countvectorizer
我在网上看到了各种文章,其中一些建议 CountVectorizer 应该适合训练集和测试集,还有一些建议它应该只适合训练集。 哪种方法通常更适合文本分类?
【问题讨论】:
标签: python python-3.x scikit-learn countvectorizer
通常test_set 应保持不可见,因此CountVectorizer 应仅安装在train_set 上
【讨论】: