混淆矩阵
混淆矩阵的基本概念
混淆矩阵分类模型的指标,属于模型评估的一部分。混淆矩阵的数值表示判断分类器(Classifier)的预测结果,适用于分类型的数据模型。其中数值包括真正里(True Positive),假正例(False Positive),真正例(True Negative),假负例(False Negative)。
- TN:真实值是负例,模型预测是负例的数量
- TP:真实值是正例,模型预测是正例的数量
- FN:真实值是正例,模型预测是负例的数量(第一类错误)
- FP:真实值是负例,模型预测是正例的数量(第二类错误)
混淆矩阵行列意义
- 真实负例总和 = TN+FP
- 真实正例总和 = FN+TP
- 模型判断为负例总和 = TN+FN
- 模型判断为正例总和 = FP+TP
混淆矩阵的指标运用
- 正确率(accuracy):模型预测正确的值和全部样本的比。可以观测分类模型预测正确占总体观测值的比重。
- 精准率(precision):模型预测正确的正例占模型总共预测的正例的比。
- 召回率(recall):模型预测正确的正例占真实正例总和的比。
- 调和平均值F1(F1-score):