机器学习之EM算法

预备知识

1 jensen不等式

回顾优化理论中的一些概念。设f是定义域为实数的函数，如果对于所有的实数x，，那么f是凸函数。当x是向量时，如果其hessian矩阵H是半正定的（），那么f是凸函数。如果或者，那么称f是严格凸函数。

Jensen不等式表述如下：

如果f是凸函数，X是随机变量，那么

特别地，如果f是严格凸函数，那么当且仅当，也就是说X是常量。

这里我们将简写为。

如果用图表示会很清晰：

机器学习之EM算法

图中，实线f是凸函数，X是随机变量，有0.5的概率是a，有0.5的概率是b。（就像掷硬币一样）。X的期望值就是a和b的中值了，图中可以看到成立。

当f是（严格）凹函数当且仅当-f是（严格）凸函数。

Jensen不等式应用于凹函数时，不等号方向反向，也就是。

当且仅当X为常数，等号成立。

EM算法

推导过程

机器学习之EM算法 (1)

令Qi表示隐含变量Z的某种分布，Qi满足的条件是机器学习之EM算法。

（1）式变换为

机器学习之EM算法 (2)

根据数学期望公式：机器学习之EM算法。

有：机器学习之EM算法，（2）式中是的数学期望。

机器学习之EM算法 (3)

根据Jensen不等式：

机器学习之EM算法是凹函数，,

机器学习之EM算法 (4)

机器学习之EM算法 (5)

机器学习之EM算法 (5)

(5）式是参数机器学习之EM算法的对数似然函数的下界。

等式成立的条件

根据Jensen不等式，机器学习之EM算法，当且仅当x为常数时，等号成立。和，有：

机器学习之EM算法

机器学习之EM算法

、

机器学习之EM算法

机器学习之EM算法

又有机器学习之EM算法

EM算法流程

初始化分布参数机器学习之EM算法；重复E、M步骤直到收敛

E-step:选择隐含变量的概率分布机器学习之EM算法

M-step: 机器学习之EM算法 \

EM算法收敛性

那么究竟怎么确保EM收敛？假定和是EM第t次和t+1次迭代后的结果。如果我们证明了，也就是说极大似然估计单调增加，那么最终我们会到达最大似然估计的最大值。下面来证明，选定后，我们得到E步

这一步保证了在给定时，Jensen不等式中的等式成立，也就是

然后进行M步，固定，并将视作变量，对上面的求导后，得到，这样经过一些推导会有以下式子成立：

解释第（4）步，得到时，只是最大化，也就是的下界，而没有使等式成立，等式成立只有是在固定，并按E步得到时才能成立。

况且根据我们前面得到的下式，对于所有的和都成立

第（5）步利用了M步的定义，M步就是将调整到，使得下界最大化。因此（5）成立，（6）是之前的等式结果。

这样就证明了会单调增加。一种收敛方法是不再变化，还有一种就是变化幅度很小。

再次解释一下（4）、（5）、（6）。首先（4）对所有的参数都满足，而其等式成立条件只是在固定，并调整好Q时成立，而第（4）步只是固定Q，调整，不能保证等式一定成立。（4）到（5）就是M步的定义，（5）到（6）是前面E步所保证等式成立条件。也就是说E步会将下界拉到与一个特定值（这里）一样的高度，而此时发现下界仍然可以上升，因此经过M步后，下界又被拉升，但达不到与另外一个特定值一样的高度，之后E步又将下界拉到与这个特定值一样的高度，重复下去，直到最大值。

相关文章：

2021-05-18
2021-12-27
2021-04-12
2021-05-06
2021-05-18
2021-11-01
2021-11-13

猜你喜欢

2021-04-25

相关资源

下载 2023-03-23
下载 2023-02-13
下载 2022-12-25

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode