这篇文章主要讲解一下机器学习中的几大评测指标
在读CTPN的论文时,遇到了Precision, Recall, F-measure三个概念
那么下面就简单从最开始的讲起
混淆矩阵
| Postive | Negative | |
|---|---|---|
| True | True Positive(TP) | True Negative(TN) |
| False | False Positive(FP) | False Negative(FN) |
TP: 正确识别为正样本
TN: 正确识别为负样本
FP: 错误识别为正样本
FN: 错误识别为负样本
助记:前者是否识别正确,后者是否本身为正
了解了混淆矩阵之后,来看看评测指标是如何定义的。
正确率Accuracy(可以看作所有样本识别正确的样本比例)
精确率Precision(也叫作正样本预测值,是正样本在预测为正的样本中所占的比例)
表明识别为正的数据中有多少为正样本
召回率Recall(正样本在所有预测为正的样本中的比例)
由于Precision和Recall在各自方面不能够评测整个模型的效果,所以引入了F-measure
F-measure(the harmonic mean of Precision and Recall)调和平均数
Traditional F-measure
添加一张图方便理解