【发布时间】:2018-04-14 00:54:57
【问题描述】:
假设我有一个数据集,我想选择与预测结果相对应的特征比其他特征更好。我已经实施了一些特征排名测试,结果如下:
对于预测模型,我选择了具有最佳“平均值”值的特征。
X = oil_10[['Sidetrack Code','Well Type Code','Well Status
Code','Producing Formation','Water Produced, bbl','County']]
这是具有“最佳选择特征”的预测模型结果:
RandomForestRegressor
0.390502562474
这是没有任何选择的具有所有数据集特征的预测模型的结果:
RandomForestRegressor
0.741878611892
如何利用Feature Ranking结果实现最佳预测结果?
【问题讨论】:
标签: python python-3.x machine-learning data-science feature-selection