查准率P:

查全率R:

两者结合之后新的指标F1分数(P、R的平均值也叫调和平均数):

利用F1这个单一实数指标来判断。

开发集以及验证集最好来自同一分布:方法是将数据全部打乱,然后从中抽取。

大量数据分配到训练集,其余少量数据分配到开发集和测试集,利用开发集选出不同的方法,测试集的目的是评估你最后的成本偏差。

人类水平误差用来估计贝叶斯误差,能够达到的最低值,当接近人类水平时,更难分辨出问题是偏差还是方差,所以此时进展会更缓慢。

模型指标和策略

模型指标和策略

误差分析:找到出现错误的例子中,影响最大的特征,对这个特征进行修改。

 

相关文章:

  • 2023-03-27
  • 2021-05-22
  • 2021-12-03
  • 2019-02-26
  • 2021-12-21
  • 2021-11-15
  • 2021-11-18
猜你喜欢
  • 2022-01-01
  • 2021-12-19
  • 2021-06-08
  • 2021-08-29
  • 2021-12-23
  • 2021-07-11
相关资源
相似解决方案