【问题标题】:The predict method shows standardized probability?预测方法显示标准化概率?
【发布时间】:2014-03-05 04:23:21
【问题描述】:

我在 Scikit-learn 中使用 AdaBoostClassifier,无论训练集有多不平衡,平均概率始终为 0.5。类预测 (predict_) 似乎给出了正确的估计,但这些并没有反映在 predict_probas 方法中,该方法总是平均为 0.5。

如果我的“真实”概率是 0.02,我如何转换标准化概率以反映该比例?

【问题讨论】:

    标签: python-2.7 probability scikit-learn prediction adaboost


    【解决方案1】:

    您的意思是每个样本的概率平均为 1/n_classes?情况必然如此; predict_proba 报告的概率是 y 的所有值的条件类概率分布 P(y|X)。要产生不同的概率,请根据您的概率模型执行任何必要的计算。

    【讨论】:

    • 是的。在 NaiveBayes 算法中,显然有一个 class_prior 参数(例如 [0.2, 0.8])。这似乎是我正在寻找的,即使 AdaBoostClassifier 不允许它。将 predict_proba 响应与类的倒数(1/0.2 或 1/0.8)相乘以获得与先验类对应的数字是否正确?
    • @OlaGustafsson 您可以随心所欲地相乘。如果你之后重新规范化,那么你所拥有的是一个带有额外先验的分类器,即一种混合模型。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2020-10-08
    • 2016-05-23
    • 1970-01-01
    • 1970-01-01
    • 2019-09-16
    • 1970-01-01
    相关资源
    最近更新 更多