【发布时间】:2021-01-06 23:54:45
【问题描述】:
我有一个使用样本数据集训练的简单 RF 分类器模型,它运行良好。
所以,我使用一些测试数据来预测目标类,假设它找到目标类为1 或0(为简单起见,将其视为二进制分类)
假设我们需要查看测试功能对预测值(0 或1)的影响。看下面的例子:
input features - [a,b,c]
predicted value - 1
input features - [a,d,c]
predicted value - 10
让我们以第一个场景为例,其中输入(测试功能)特征是 a、b 和 c,这将产生 1
所以现在我想检查一下这些功能(a、b、c),哪些功能对预测值的影响最大1
我该怎么做?
PS:我知道如何检查训练数据集的特征重要性,但在这种情况下,它不是训练数据集,而是测试数据集,目标类仅在预测后获得。
【问题讨论】:
标签: python machine-learning random-forest