机器学习：准确率(Accuracy), 精确率(Precision), 召回率(Recall), F-measure

这篇文章主要讲解一下机器学习中的几大评测指标
在读CTPN的论文时，遇到了Precision, Recall, F-measure三个概念
那么下面就简单从最开始的讲起

混淆矩阵

	Postive	Negative
True	True Positive(TP)	True Negative(TN)
False	False Positive(FP)	False Negative(FN)

TP: 正确识别为正样本
TN: 正确识别为负样本
FP: 错误识别为正样本
FN: 错误识别为负样本

助记：前者是否识别正确，后者是否本身为正

了解了混淆矩阵之后，来看看评测指标是如何定义的。

正确率Accuracy(可以看作所有样本识别正确的样本比例)
$ACC=\frac{TP+TN}{TP+TN+FP+FN}$

精确率Precision(也叫作正样本预测值，是正样本在预测为正的样本中所占的比例)
表明识别为正的数据中有多少为正样本
$Precision=\frac{TP}{TP+FP}$

召回率Recall(正样本在所有预测为正的样本中的比例)

$Recall=\frac{TP}{TP+FN}$

由于Precision和Recall在各自方面不能够评测整个模型的效果，所以引入了F-measure
F-measure(the harmonic mean of Precision and Recall)调和平均数

Traditional F-measure
$F = 2 * \frac{Precision * Recall}{ Precision + Recall}$

添加一张图方便理解