【发布时间】:2018-02-19 04:23:04
【问题描述】:
在 sklearn 中使用随机森林进行二元分类时。
我知道我可以使用clf.predict(X) 来获得预测的课程。
当我使用clf.predict_proba(X) 时,我得到一个如下所示的数组:
我认为第一列表示预测的概率? 如何获得一个类别为 1 的概率的列?
【问题讨论】:
标签: python scikit-learn random-forest
在 sklearn 中使用随机森林进行二元分类时。
我知道我可以使用clf.predict(X) 来获得预测的课程。
当我使用clf.predict_proba(X) 时,我得到一个如下所示的数组:
我认为第一列表示预测的概率? 如何获得一个类别为 1 的概率的列?
【问题讨论】:
标签: python scikit-learn random-forest
来自RandomForest.predict_proba 文档:
predict_proba(X)预测 X 的类别概率。
返回:
p:[...] 输入样本的类别概率。这 类的顺序对应于属性classes_中的顺序。
您可以查看clf.classes_ 属性,查看您的类1 出现在哪个索引处,然后按如下方式访问概率:
prob_class_1 = clf.predict_proba(X)[:, i]
其中i 是clf.classes_ 中类1 的索引。
【讨论】:
predict_proba 的情况下运行它,我会将所有类都设为1,它们在predict_proba(X)[:,1] 中的值大于0.5是否正确?跨度>