【问题标题】:Get a column of probability values for a certain class获取某一类的一列概率值
【发布时间】:2018-02-19 04:23:04
【问题描述】:

在 sklearn 中使用随机森林进行二元分类时。 我知道我可以使用clf.predict(X) 来获得预测的课程。 当我使用clf.predict_proba(X) 时,我得到一个如下所示的数组:

我认为第一列表示预测的概率? 如何获得一个类别为 1 的概率的列?

【问题讨论】:

    标签: python scikit-learn random-forest


    【解决方案1】:

    来自RandomForest.predict_proba 文档:

    predict_proba(X)
    

    预测 X 的类别概率。

    返回
    p:[...] 输入样本的类别概率。这 类的顺序对应于属性classes_中的顺序。

    您可以查看clf.classes_ 属性,查看您的类1 出现在哪个索引处,然后按如下方式访问概率:

    prob_class_1 = clf.predict_proba(X)[:, i] 
    

    其中iclf.classes_ 中类1 的索引。

    【讨论】:

    • 为了确定,如果我在没有predict_proba 的情况下运行它,我会将所有类都设为1,它们在predict_proba(X)[:,1] 中的值大于0.5是否正确?跨度>
    • 是的,因为它是二进制分类。但更一般地说,分配概率最大的类。
    猜你喜欢
    • 2019-06-16
    • 2014-11-18
    • 1970-01-01
    • 1970-01-01
    • 2014-07-26
    • 2019-07-05
    • 2016-12-17
    • 2020-10-03
    • 2016-07-14
    相关资源
    最近更新 更多