贝叶斯判别规则是以错分概率风险最小为准则的判别规则,这两种的策略是不同的。

1. 贝叶斯决策的错分概率

两分类问题的情况下,贝叶斯分类是一定是最小错分概率的。因为分类就两种,也就是不是P(A|B)不是正确的就是错误的,没有第三种可能,所以根据贝叶斯公式选择最大概率max{ P(A|B), P(~A|B)}的结果P,因为我总会选那个概率最大的,概率和为1的情况下,剩下的自然是小的。

举例:下雨为事件A,有乌云为事件B,假设P(A|B)的概率为0.6,所以P(~A|B)也就是不下雨的概率为0.4,那么认为下雨的错误率就是0.4,显而易见。

多分类问题的情况下,假设有M种可能性,正确的分类仍然仅一种(记为类别right),那么错分就有M-1种。

计算一个总的错误率,即所有分为不是right类的概率的和:

贝叶斯决策论理解

因为M类是x条件下的所有可能分类,总概率为1,所以:

贝叶斯决策论理解

也就是1-right类概率。那么换句话说,如果想让分类器错误率最小,那就让后验概率P(ωright|x)最大即可。所以多分类就是选择P(ωm|x)最大的那一分类作为right就可以使得损失最小了。

多提一句:如果想让后验概率P(ωright|x) 最大,如果x参数未知,那就可以用最大似然估计来求解x。如果以Sigmoid函数作为事件为真(或者判断为类1)的后验概率,用线性回归模型的预测结果去逼近真实标记(也就是0,1两种标记)的对数几率,那么就可以最大似然估计来求解参数了,这就是逻辑回归的思路。

判定标准

(i)二分类

贝叶斯公式:

贝叶斯决策论理解

所以有,常用的判别,也就是1/P(x)作为公共项,在比较时可以省去

贝叶斯决策论理解

 额外有两个定义,但是似乎不太常见:

贝叶斯决策论理解

(ii)多分类:

Max1~m{ P(ωm|x)} 就是最佳分类。

2. 贝叶斯最小风险判别

在一些情况下,最小错误率不一定为最佳。实际情况不是这样的,比如对于药品的检测,对于药品生产商而言,大部分的药品都是合格的,只有少数的不合格。如果我们把正常药品判断成异常药品,这样会增加总的错误率,给企业带来一些损失;但如果把异常药品判断成正常药品,虽然会使错误率最小,但病人可能会被使用不合格的药品,对治疗非常不利,甚至会使得病人耽误治疗,乃至于有生命危险。这样看,假阳性比假阴性要危险很多,所以要尽量减少假阳性出现的情况。可见这时使用错误率最小是不合适的。所以说,单纯地考虑后验概率的最小错误率,会带来更多的损失和风险,为了体现这种风险,我们对贝叶斯公式进行加权修正

 

条件平均风险rj(x)公式为

贝叶斯决策论理解

其中Lij是把ωi类分为ωj类的风险。Lij的取值为:

若i=j,即判别正确, Lij可以取负值或零,表示没有风险;

若i≠j,即判别错误, Lij应取正值,表示各种错分情况下的风险。

根据贝叶斯公式,式子可以写成:

贝叶斯决策论理解

由于P(x)是公共项目,所以可以省去,所以式子为:

贝叶斯决策论理解

 

举例二分类情况:

R1(x)的风险为2类分成1类的风险乘以2类的后验概率。

贝叶斯决策论理解

R2(x)的风险为1类分成2类的风险乘以1类的后验概率。

贝叶斯决策论理解

 

 

参考:

https://zhuanlan.zhihu.com/p/82402288 贝叶斯判别简要原理及其实例

https://www.zhihu.com/question/27670909/answer/540328411 如何简单理解贝叶斯决策理论

相关文章:

  • 2021-05-24
  • 2022-12-23
  • 2021-12-25
  • 2021-11-12
  • 2021-10-02
  • 2021-12-01
猜你喜欢
  • 2021-07-21
  • 2021-07-30
相关资源
相似解决方案