混淆矩阵分类模型评估

混淆矩阵

混淆矩阵的基本概念

混淆矩阵分类模型的指标，属于模型评估的一部分。混淆矩阵的数值表示判断分类器（Classifier）的预测结果，适用于分类型的数据模型。其中数值包括真正里（True Positive），假正例（False Positive），真正例（True Negative），假负例（False Negative）。

TN：真实值是负例，模型预测是负例的数量
TP：真实值是正例，模型预测是正例的数量
FN：真实值是正例，模型预测是负例的数量（第一类错误）
FP：真实值是负例，模型预测是正例的数量（第二类错误）

混淆矩阵分类模型评估

混淆矩阵行列意义

真实负例总和 = TN+FP
真实正例总和 = FN+TP
模型判断为负例总和 = TN+FN
模型判断为正例总和 = FP+TP

混淆矩阵分类模型评估

混淆矩阵的指标运用

正确率(accuracy)：模型预测正确的值和全部样本的比。可以观测分类模型预测正确占总体观测值的比重。

$正确率 = \frac{TP+TN}{TP+TN+FP+FN}$

精准率(precision)：模型预测正确的正例占模型总共预测的正例的比。

$精准率 = \frac{TP}{TP+FP}$

召回率(recall)：模型预测正确的正例占真实正例总和的比。

$召回率 = \frac{TP}{TP+FN}$

调和平均值F1(F1-score)：

$F1 = \frac{2*precision*recall}{precision+recall}$