贝叶斯决策论理解

贝叶斯判别规则是以错分概率或风险最小为准则的判别规则，这两种的策略是不同的。

1. 贝叶斯决策的错分概率

两分类问题的情况下，贝叶斯分类是一定是最小错分概率的。因为分类就两种，也就是不是P(A|B)不是正确的就是错误的，没有第三种可能，所以根据贝叶斯公式选择最大概率max{ P(A|B), P(~A|B)}的结果P，因为我总会选那个概率最大的，概率和为1的情况下，剩下的自然是小的。

举例：下雨为事件A，有乌云为事件B，假设P(A|B)的概率为0.6，所以P(~A|B)也就是不下雨的概率为0.4，那么认为下雨的错误率就是0.4，显而易见。

多分类问题的情况下，假设有M种可能性，正确的分类仍然仅一种（记为类别right），那么错分就有M-1种。

计算一个总的错误率，即所有分为不是right类的概率的和：

贝叶斯决策论理解

因为M类是x条件下的所有可能分类，总概率为1，所以：

贝叶斯决策论理解

也就是1-right类概率。那么换句话说，如果想让分类器错误率最小，那就让后验概率P(ωright|x)最大即可。所以多分类就是选择P(ωm|x)最大的那一分类作为right就可以使得损失最小了。

多提一句：如果想让后验概率P(ωright|x) 最大，如果x参数未知，那就可以用最大似然估计来求解x。如果以Sigmoid函数作为事件为真（或者判断为类1）的后验概率，用线性回归模型的预测结果去逼近真实标记(也就是0,1两种标记)的对数几率，那么就可以最大似然估计来求解参数了，这就是逻辑回归的思路。

判定标准

(i)二分类：

贝叶斯公式：

贝叶斯决策论理解

所以有，常用的判别，也就是1/P(x)作为公共项，在比较时可以省去：

贝叶斯决策论理解

额外有两个定义，但是似乎不太常见：

贝叶斯决策论理解

(ii)多分类：

Max1~m{ P(ωm|x)} 就是最佳分类。

2. 贝叶斯最小风险判别

在一些情况下，最小错误率不一定为最佳。实际情况不是这样的，比如对于药品的检测，对于药品生产商而言，大部分的药品都是合格的，只有少数的不合格。如果我们把正常药品判断成异常药品，这样会增加总的错误率，给企业带来一些损失；但如果把异常药品判断成正常药品，虽然会使错误率最小，但病人可能会被使用不合格的药品，对治疗非常不利，甚至会使得病人耽误治疗，乃至于有生命危险。这样看，假阳性比假阴性要危险很多，所以要尽量减少假阳性出现的情况。可见这时使用错误率最小是不合适的。所以说，单纯地考虑后验概率的最小错误率，会带来更多的损失和风险，为了体现这种风险，我们对贝叶斯公式进行加权修正。

条件平均风险rj(x)公式为：

贝叶斯决策论理解