【问题标题】:Feature selection in mixed data type混合数据类型中的特征选择
【发布时间】:2020-04-13 23:03:09
【问题描述】:

我有一个庞大的数据集,其中包含数字和分类变量的混合。我遇到过各种特征选择技术,主要关注数字或分类数据,而不是它们的混合。是否有任何特征选择技术适用于这样的数据集?

【问题讨论】:

    标签: python machine-learning feature-selection


    【解决方案1】:

    您正在寻找 Boruta 包,它最初是用 R 编写的,但也可以在 python 中使用。 Boruta 使用随机森林对特征进行排名,但您首先必须处理特征中的所有缺失值,否则 boruta 会引发错误。在这里查看更多信息:

    https://datascience.stackexchange.com/questions/31112/boruta-feature-selection-package

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2020-11-09
      • 2020-04-01
      • 2014-09-21
      • 1970-01-01
      • 1970-01-01
      • 2020-09-21
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多