1. 狄利克雷分布:

    是一个多维分布,一个K 维狄利克雷分布的参数是一个K维向量狄利克雷分布 =[狄利克雷分布狄利克雷分布],

狄利克雷分布的概率密度函数为:

狄利克雷分布——————————————————————1

其中狄利克雷分布 是变量,且狄利克雷分布狄利克雷分布 表示伽马函数。在这里伽马函数部分充当的是归一化因子的作用。

我们把狄利克雷分布记作狄利克雷分布

2.分类分布(Categorical distribution),也叫离散分布(Discrete Distribution):

    概率质量函数(分布列,相当于在连续分布中的概率密度函数)为:

狄利克雷分布其中狄利克雷分布 ——————————————————2

这个函数的意思就是,变量z取值为k的概率是狄利克雷分布

记作狄利克雷分布

3.多项式分布:

我们从狄利克雷分布中采样N 次,把取值为k 的样本个数记为狄利克雷分布,那么随机变量狄利克雷分布服从参数为N和狄利克雷分布的多项式分布(Multinomial Distribution),其概率质量函数为

狄利克雷分布————————————————————————3

 

 

由以上三个分布的概率质量函数,现在以狄利克雷分布为先验(即让离散分布和多项分布中的参数π服从狄利克雷分布),在有了N个观测样本之后参数π的后验分布为:

狄利克雷分布

    狄利克雷分布————————————————————————4    

比较得,π的先验分布(式1)与后验分布(式4)具有相同的形式不同的参数,所以我们说狄利克雷分布是离散分布和多项式分布的共轭先验

当我们观察到更多的样本时,只需更新后验分布的参数便可得到新的后验分布为狄利克雷分布而不需要对π的分布进行估计。这是以狄利克雷分布作为先验的优势所在。

相关文章: