【发布时间】:2017-10-27 05:44:37
【问题描述】:
我的问题是我应该先对整个数据集执行selectkbest sklearn 函数以进行特征选择,然后将数据集划分为训练和测试集,还是应该在划分后对训练和测试数据集执行selectkbest?在第二个中,是否有可能为测试数据集选择不同的 k 特征而不是用于训练的特征?我对机器学习很陌生,最近刚刚了解了一些关于特征选择的知识。
我在这里使用单变量特征选择示例来了解 selectkbest - http://scikit-learn.org/stable/modules/feature_selection.html 为例
【问题讨论】:
标签: machine-learning scikit-learn