【发布时间】:2017-06-16 02:35:47
【问题描述】:
我的目标:
- 使用
SelectKBest(KBest) 和k="all",对排名特征进行排序(简单易行) - 绘制已排序特征 (pretty much as this example for recursive feature elimination, RFECV) 的递归/渐进式交叉验证性能,即 1) 计算最顶层特征的交叉验证性能,2) 然后计算最顶层 + 第二个顶层的 cv 性能,3) 然后 + 第三个,... n) 所有特征组合。 (有点辛苦,没有完成)
- 如下图所示绘制结果(只是使用排序的
KBest-all特征而不是RFECV)。 (简单)。
是的,我可以k-循环所有排名特征,然后“转换”数据以仅允许 k 最佳特征,然后计算每个的交叉验证性能,最后得到所有分数并绘制... -- 我想避免这段代码。
我期待我猜的标准答案,一些像这样的包装函数一定已经存在于优秀的scikit-learn 库中。
也许GridSearchCV 可行?
【问题讨论】:
-
可能这是您应该寻找的功能(RFECV,而不是 RFE)。具有递归特征消除和交叉验证选择最佳特征数量的特征排名。 scikit-learn.org/stable/modules/generated/…
-
是的——我的错,我本来是想写RFECV的
标签: python machine-learning scikit-learn feature-extraction bigdata