人智导(十四):学习模型的效果评价

准确度度量

侧重在模型的预测能力方面,其次才是其它方面,如效率,可伸缩性等等
人智导(十四):学习模型的效果评价

a:TP(真正 true positive)
b:FN(假负 false negative)
c:FP (假正 false positive)
d:TN(真负 true negative)
准确度:Accuracy=a+da+b+c+dAccuracy=\frac{a+d}{a+b+c+d}
准确度度量的局限性:

  • 在一些应用情况中,准确度度量是不合适的
  • 我们考虑二分类(0, 1)问题:
    • 0类例子的数量:1145141919810
    • 1类例子的数量:1919
    • 假如预测每一个都是类别0,其准确度很高
    • 这样的准确度产生了误导,因为模型没有识别出任何一个类型1的例子

精度和召回率度量

人智导(十四):学习模型的效果评价

Precision(p)=aa+cPrecision(p) = \frac{a}{a+c}
Recall(r)=aa+bRecall(r) = \frac{a}{a+b}

F-值度量

人智导(十四):学习模型的效果评价

  • F-值度量:Fmeasure(F)=2rpr+p=2a2a+b+cF-measure(F) = \frac{2rp}{r+p}=\frac{2a}{2a+b+c}
  • F-值度量把精度(precision)和召回率(recall)组合为一
  • 两个度量出现的问题
    • precison p = 100%
    • recall r = 1%

ROC曲线

人智导(十四):学习模型的效果评价

数据不平衡情况
例如: +:患病 ;-:健康
人智导(十四):学习模型的效果评价

真正率 TP rate = TP / (TP + FN)
假正率 FP rate = FP / (FP + TN)

评估方法

  • 保持法(holdout):训练集和验证集
    • 蒙特卡洛交叉验证
  • k-折交叉验证
    • 数据集划分为k份
    • 使用k-1份作为训练集,1份作为测试集,然后k次交叉验证

相关文章:

  • 2021-07-15
  • 2021-11-05
  • 2018-09-01
  • 2021-05-12
  • 2021-08-19
  • 2022-12-23
  • 2022-12-23
  • 2021-12-15
猜你喜欢
  • 2021-04-07
  • 2021-09-11
  • 2021-11-05
  • 2022-01-02
  • 2022-01-23
  • 2022-12-23
  • 2021-11-30
相关资源
相似解决方案