【发布时间】:2017-11-27 07:20:12
【问题描述】:
我的基本模型是具有 65 个特征的逻辑回归分类器。
我现在从这 65 个特征中推断出所有可能的多项式特征,然后对前 100 个特征进行 SelectKBest 修剪(使用 chi2 标准)。 当我将其与我的基本模型进行比较时,我发现精度和召回率显着降低。
我的问题是为什么 selectKBest 在任何情况下都会降低性能?如果外推多项式特征没有用,那么它应该选择原始的 65 个特征,从而为我提供与基本模型相同或更好的性能。
我无法理解 selectKBest 特征修剪如何影响我的表现?
【问题讨论】:
标签: machine-learning scikit-learn logistic-regression feature-selection supervised-learning