【发布时间】:2020-04-13 23:03:09
【问题描述】:
我有一个庞大的数据集,其中包含数字和分类变量的混合。我遇到过各种特征选择技术,主要关注数字或分类数据,而不是它们的混合。是否有任何特征选择技术适用于这样的数据集?
【问题讨论】:
标签: python machine-learning feature-selection
我有一个庞大的数据集,其中包含数字和分类变量的混合。我遇到过各种特征选择技术,主要关注数字或分类数据,而不是它们的混合。是否有任何特征选择技术适用于这样的数据集?
【问题讨论】:
标签: python machine-learning feature-selection
您正在寻找 Boruta 包,它最初是用 R 编写的,但也可以在 python 中使用。 Boruta 使用随机森林对特征进行排名,但您首先必须处理特征中的所有缺失值,否则 boruta 会引发错误。在这里查看更多信息:
https://datascience.stackexchange.com/questions/31112/boruta-feature-selection-package
【讨论】: