机器学习之平滑技术

机器学习之平滑技术

机器学习之平滑技术

 

机器学习之平滑技术

机器学习之平滑技术

拉普拉斯平滑(Laplace smoothing)
也就是参数为1时的贝叶斯估计,当某个分量在总样本某个分类中(观察样本库/训练集)从没出现过,会导致整个实例的计算结果为0。为了解决这个问题,使用拉普拉斯平滑/加1平滑进行处理。
它的思想非常简单,就是对先验概率的分子(划分的计数)加1,分母加上类别数;对条件概率分子加1,分母加上对应特征的可能取值数量。这样在解决零概率问题的同时,也保证了概率和依然为1。

eg:假设在文本分类中,有3个类,C1、C2、C3,在指定的训练样本中,某个词语F1,在各个类中观测计数分别为=0,990,10,即概率为P(F1/C1)=0,P(F1/C2)=0.99,P(F1/C3)=0.01,对这三个量使用拉普拉斯平滑的计算方法如下:
1/1003 = 0.001,991/1003=0.988,11/1003=0.011

相关参考:https://blog.csdn.net/fuqiuai/article/details/79458943

详细讲解见:第41讲

相关文章:

  • 2021-09-14
  • 2022-12-23
  • 2021-11-18
  • 2022-01-10
  • 2021-05-17
  • 2021-08-10
  • 2021-04-29
  • 2021-09-06
猜你喜欢
  • 2022-12-23
  • 2022-02-03
  • 2021-09-16
  • 2021-06-23
  • 2021-11-25
  • 2021-12-22
  • 2021-08-21
相关资源
相似解决方案