机器学习评价指标
机器学习评价指标
对于二类分类器/分类算法,评价指标主要有accuracy, [precision,recall,F-score,pr曲线],ROC-AUC曲线,gini系数。
对于多类分类器/分类算法,评价指标主要有accuracy, [宏平均和微平均,F-score]。
对于回归分析,主要有mse和r2/拟合优度。
混淆矩阵
混淆矩阵是机器学习中总结分类模型预测结果的情形分析表,以矩阵形式将数据集中的记录按照真实的类别与分类模型预测的类别判断两个标准进行汇总,在给定一个模型的预测标签时,它可以被用来快速计算精度和召回率
对于一个二分类问题,那么预测结果和实际结果两两结合会出现如下四种情况,真正例(TP)、假正例(FP)、真反例(TN),以及假反例(FN)。
TP:预测为1,实际为1,预测正确。True Positive
FP:预测为1,实际为0,预测错误。False Positive
FN:预测为0,实际为1,预测错误。False Negative
TN:预测为0,实际为0,预测正确。True Negative
准确率 (ACC)
预测正确的结果占总样本的百分比
虽然准确率能够判断总的正确率,但是在样本不均衡的情况下,并不能作为很好的指标来衡量结果。
精确率 (precision)
精确率(Precision) 是针对预测结果而言的,其含义是在被所有预测为正的样本中实际为正样本的概率
精确率和准确率看上去有些类似,但是是两个完全不同的概念。精确率代表对正样本结果中的预测准确程度,准确率则代表整体的预测准确程度,包括正样本和负样本。
召回率(recall)
召回率(Recall) 是针对原样本而言的,其含义是在实际为正的样本中被预测为正样本的概率
F1 分数
使用调和平均结合召回率和精度的指标