预测方法显示标准化概率？

【问题标题】：The predict method shows standardized probability?预测方法显示标准化概率？
【发布时间】：2014-03-05 04:23:21
【问题描述】：

我在 Scikit-learn 中使用 AdaBoostClassifier，无论训练集有多不平衡，平均概率始终为 0.5。类预测 (predict_) 似乎给出了正确的估计，但这些并没有反映在 predict_probas 方法中，该方法总是平均为 0.5。

如果我的“真实”概率是 0.02，我如何转换标准化概率以反映该比例？

【问题讨论】：

【解决方案1】：

您的意思是每个样本的概率平均为 1/n_classes？情况必然如此； predict_proba 报告的概率是 y 的所有值的条件类概率分布 P(y|X)。要产生不同的概率，请根据您的概率模型执行任何必要的计算。

【讨论】：

是的。在 NaiveBayes 算法中，显然有一个 class_prior 参数（例如 [0.2, 0.8]）。这似乎是我正在寻找的，即使 AdaBoostClassifier 不允许它。将 predict_proba 响应与类的倒数（1/0.2 或 1/0.8）相乘以获得与先验类对应的数字是否正确？
@OlaGustafsson 您可以随心所欲地相乘。如果你之后重新规范化，那么你所拥有的是一个带有额外先验的分类器，即一种混合模型。