【发布时间】:2017-12-07 18:05:53
【问题描述】:
我正在使用 python 使用多项 Logistic 回归执行特征选择(在具有 1,00,000 行和 32 个特征的数据集上)。现在,选择特征以构建多类目标变量模型的最有效方法是什么( 1,2,3,4,5,6,7)?
【问题讨论】:
-
特征选择是一个巨大的话题。我投票结束这个问题太宽泛了。
-
这似乎更像是一个统计问题,应该在 stats.stackexchange.com> 。但是为了给你一些东西给谷歌:你可以做一个套索来选择特征。但是,是的,这是一个很大的话题
-
检查网络上的boruta功能选择link我试过了,效果很好。它模仿 sklearn 界面,因此您可以使用它来选择然后应用分类器/回归器。但是,特征选择/提取的方法有很多
标签: python machine-learning scikit-learn logistic-regression