混淆矩阵 Confusion Matrix:
例如预测10000个人是否患病。其中0代表不患病,1代表患病。
下图表示有9978个人没有患病,算法也预测他们没有患病;
有12个人没有患病,但算法预测他们患病;
有2个人患病,但算法预测他们没有患病;
有8个人患病,算法也预测他们患病;
精准率和召回率:
精准率:预测为1的数据中,预测对了的概率
召回率:真实为1的数据中,预测对了的概率
F1 Score:
精准率和召回率兼顾,是两者的调和平均值。
调和平均值的特点:如果一个值特别高,一个值特别低,那么得到的F1 Score 也将特别的低,只有二者都非常高,得到的F1值才会特别高。
F1取值范围0到1。
精准率-召回率曲线:
横坐标为threshold,纵坐标为Precision / Recall :
横坐标为Precision,纵坐标为Recall :
ROC曲线:
描述TPR 和 FPR之间的关系。
TPR :True Positive Rate,等于Recall,即真实为1的数据中,预测对了的概率
FPR : False Positive Rate,即真实为0的数据中,预测错了的概率