【问题标题】:Multiclass classification confidence score using multiclass classification using predict_proba of SGDclassifier使用 SGDclassifier 的 predict_proba 进行多类分类的多类分类置信度得分
【发布时间】:2020-06-14 10:19:12
【问题描述】:
我在 SGDClassifier 中使用逻辑回归来执行 ~10k 类别的多类分类。
为了获得预测结果的置信度分数,我使用了 predict_proba 函数。
但是对于正确和错误的预测,我得到的预测概率值为 0.00026091,0.00049697,0.00019632。
请提出标准化分数的方法,以便我可以通过过滤概率值来考虑结果
【问题讨论】:
标签:
probability
logistic-regression
prediction
multiclass-classification
sgd
【解决方案1】:
如果所有类别的概率值都非常低,这可能意味着您的分类器很难对样本进行分类。您可能想做一些特征工程或尝试其他模型。
要标准化这些值,请查看 scikit-learn MinMaxScaler。这会将数据缩放到 0 到 1 之间的数字。但正如我所说,如果所有值的概率都非常低,那么您将不会得到好的分类结果。
希望有帮助