混淆矩阵

混淆矩阵的基本概念

混淆矩阵分类模型的指标,属于模型评估的一部分。混淆矩阵的数值表示判断分类器(Classifier)的预测结果,适用于分类型的数据模型。其中数值包括真正里(True Positive),假正例(False Positive),真正例(True Negative),假负例(False Negative)。

  • TN:真实值是负例,模型预测是负例的数量
  • TP:真实值是正例,模型预测是正例的数量
  • FN:真实值是正例,模型预测是负例的数量(第一类错误)
  • FP:真实值是负例,模型预测是正例的数量(第二类错误)

混淆矩阵 分类模型评估

混淆矩阵行列意义

  • 真实负例总和 = TN+FP
  • 真实正例总和 = FN+TP
  • 模型判断为负例总和 = TN+FN
  • 模型判断为正例总和 = FP+TP

混淆矩阵 分类模型评估

混淆矩阵的指标运用

  • 正确率(accuracy):模型预测正确的值和全部样本的比。可以观测分类模型预测正确占总体观测值的比重。

=TP+TNTP+TN+FP+FN 正确率 = \frac{TP+TN}{TP+TN+FP+FN}

  • 精准率(precision):模型预测正确的正例占模型总共预测的正例的比。

=TPTP+FP 精准率 = \frac{TP}{TP+FP}

  • 召回率(recall):模型预测正确的正例占真实正例总和的比。

=TPTP+FN 召回率 = \frac{TP}{TP+FN}

  • 调和平均值F1(F1-score):

F1=2precisionrecallprecision+recall F1 = \frac{2*precision*recall}{precision+recall}

相关文章: