【发布时间】:2020-11-25 18:39:46
【问题描述】:
我正在尝试使用 10 个分类变量(所有相同的尺度 1 到 10)在分类变量(3 个级别 = 低、中、高)上拟合模型。我用随机森林运行递归特征消除(RFE),结果是所有变量都具有相似的重要性(每个约 10%)。我期待一个主导变量,但事实并非如此。这怎么解释?我应该尝试不同的建模方式还是这只是数据的本质?
PS:我运行了一个 corr 矩阵,所有 10 个特征与目标变量的相关性都较低。如果是这种情况,我是否应该期望在相关性较低的情况下没有变量占主导地位?
【问题讨论】:
-
“如何解释?我应该尝试不同的建模还是这只是数据的性质?”如果没有关于数据的任何信息,就不可能回答这个问题
标签: machine-learning scikit-learn random-forest