【问题标题】:Feature Selection(How to interpret the results)?特征选择(如何解释结果)?
【发布时间】:2018-04-14 00:54:57
【问题描述】:

假设我有一个数据集,我想选择与预测结果相对应的特征比其他特征更好。我已经实施了一些特征排名测试,结果如下:

对于预测模型,我选择了具有最佳“平均值”值的特征。

X = oil_10[['Sidetrack Code','Well Type Code','Well Status  
Code','Producing Formation','Water Produced, bbl','County']]

这是具有“最佳选择特征”的预测模型结果:

RandomForestRegressor
0.390502562474

这是没有任何选择的具有所有数据集特征的预测模型的结果:

RandomForestRegressor
0.741878611892

如何利用Feature Ranking结果实现最佳预测结果?

【问题讨论】:

    标签: python python-3.x machine-learning data-science feature-selection


    【解决方案1】:

    好吧,我尝试过这样解决我的问题: 我刚刚删除了最不重要的特征(其平均重要性值小于 0.15),准确率保持在 75% 不变,但现在预测模型的运行速度要快得多。

    【讨论】:

      猜你喜欢
      • 2021-07-26
      • 1970-01-01
      • 2020-10-24
      • 2023-03-26
      • 2014-09-21
      • 2013-11-14
      • 2020-08-20
      • 2013-02-21
      相关资源
      最近更新 更多