总结自《机器学习》周志华 2.3

目录

最常用的是查准率P(precision),查全率R(recall),F1

一、对于二分类问题

二、对于多分类问题

1.macro

2.micro



一、对于二分类问题

混淆矩阵(confusion matrix):
 

  预测结果   
真实情况 正例  反例 
正例  TP,true positive,真正 FN,false negative 假反
反例  FP ,false positive,假正 TN,true negative 真反

P,R,F1 等性能度量(二分类、多分类)      查准率=真正 / (真正+假正) = predicted and true positive/ predicted positive

P,R,F1 等性能度量(二分类、多分类)   查全率= 真正 /(真正+假反) = predicted and true positive/ true positive

P , R是一对矛盾的度量,一般一个的值高了,另一个的值就会降低,

P-R图:

若学习器A的 P-R曲线 将学习器B的 P-R曲线 完全包住,则学习器A 在该问题上 优于 B

若A B的P-R曲线有交叉, 则比较P-R曲线下面积的大小,越大越好

 

平衡点 break even point BEP,是P==R 时的取值

F值度量:

P,R,F1 等性能度量(二分类、多分类)                                P,R,F1 等性能度量(二分类、多分类)    ,n为样例总数

P,R,F1 等性能度量(二分类、多分类)          β>1,R有更大影响,β<1,P有更大影响

 

二、对于多分类问题

多分类问题,每两两类别组合,构成n个二分类问题,每个二分类问题对应一个混淆矩阵

1.macro

先在各个混淆矩阵上分别计算P,R, 再求平均得到 宏查准率macro-P, 宏查全率macro-R,

基于宏查准率macro-P, 宏查全率macro-R,计算 宏F1 macro-F1

P,R,F1 等性能度量(二分类、多分类)             P,R,F1 等性能度量(二分类、多分类)

P,R,F1 等性能度量(二分类、多分类)

2.micro

将各个混淆矩阵的对应元素进行平均,得到TP,FP,TN,FN的平均值:P,R,F1 等性能度量(二分类、多分类)

P,R,F1 等性能度量(二分类、多分类)      P,R,F1 等性能度量(二分类、多分类)

P,R,F1 等性能度量(二分类、多分类)

 

转载:https://blog.csdn.net/k411797905/article/details/89735604#%E6%9C%80%E5%B8%B8%E7%94%A8%E7%9A%84%E6%98%AF%E6%9F%A5%E5%87%86%E7%8E%87P%EF%BC%88precision%EF%BC%89%EF%BC%8C%E6%9F%A5%E5%85%A8%E7%8E%87R%EF%BC%88recall%EF%BC%89%EF%BC%8CF1
 

相关文章:

  • 2022-12-23
  • 2021-06-25
  • 2021-09-21
  • 2021-05-31
  • 2021-09-28
  • 2022-12-23
  • 2021-11-29
  • 2021-07-12
猜你喜欢
  • 2021-12-29
  • 2021-06-02
  • 2022-12-23
  • 2021-12-10
  • 2021-05-19
  • 2021-07-14
相关资源
相似解决方案