获取某一类的一列概率值

【问题标题】：Get a column of probability values for a certain class获取某一类的一列概率值
【发布时间】：2018-02-19 04:23:04
【问题描述】：

在 sklearn 中使用随机森林进行二元分类时。我知道我可以使用clf.predict(X) 来获得预测的课程。当我使用clf.predict_proba(X) 时，我得到一个如下所示的数组：

我认为第一列表示预测的概率？如何获得一个类别为 1 的概率的列？

【问题讨论】：

【解决方案1】：

来自RandomForest.predict_proba 文档：

predict_proba(X)
预测 X 的类别概率。

返回：
p：[...] 输入样本的类别概率。这类的顺序对应于属性classes_中的顺序。

您可以查看clf.classes_ 属性，查看您的类1 出现在哪个索引处，然后按如下方式访问概率：

prob_class_1 = clf.predict_proba(X)[:, i]

其中i 是clf.classes_ 中类1 的索引。

【讨论】：

为了确定，如果我在没有predict_proba 的情况下运行它，我会将所有类都设为1，它们在predict_proba(X)[:,1] 中的值大于0.5是否正确？跨度>
是的，因为它是二进制分类。但更一般地说，分配概率最大的类。