这篇文章主要讲解一下机器学习中的几大评测指标
在读CTPN的论文时,遇到了Precision, Recall, F-measure三个概念
那么下面就简单从最开始的讲起

混淆矩阵

Postive Negative
True True Positive(TP) True Negative(TN)
False False Positive(FP) False Negative(FN)

TP: 正确识别为正样本
TN: 正确识别为负样本
FP: 错误识别为正样本
FN: 错误识别为负样本

助记:前者是否识别正确,后者是否本身为正

了解了混淆矩阵之后,来看看评测指标是如何定义的。

正确率Accuracy(可以看作所有样本识别正确的样本比例)
ACC=TP+TNTP+TN+FP+FN ACC=\frac{TP+TN}{TP+TN+FP+FN}

精确率Precision(也叫作正样本预测值,是正样本在预测为正的样本中所占的比例)
表明识别为正的数据中有多少为正样本
Precision=TPTP+FP Precision=\frac{TP}{TP+FP}

召回率Recall(正样本在所有预测为正的样本中的比例)

Recall=TPTP+FN Recall=\frac{TP}{TP+FN}

由于Precision和Recall在各自方面不能够评测整个模型的效果,所以引入了F-measure
F-measure(the harmonic mean of Precision and Recall)调和平均数

Traditional F-measure
F=2PrecisionRecallPrecision+Recall F = 2 * \frac{Precision * Recall}{ Precision + Recall}

添加一张图方便理解

机器学习:准确率(Accuracy), 精确率(Precision), 召回率(Recall), F-measure

相关文章: