[Python嗯~机器学习]---EM算法的基本理解

EM算法的基本理解

为什么要用EM算法（最大期望算法）？

在机器学习中，我们观察样本，建立模型，然后训练，进行预测。这是一个正常的流程，但是我们想一个问题，现实生活中一定有很多因素使我们无法观测的，也就是隐含数据？怎么办？

[Python嗯~机器学习]---EM算法的基本理解算法。。。

如果，只有模型而没有模型参数，那么
1、先猜想隐含数据（ [Python嗯~机器学习]---EM算法的基本理解算法的步）。
2、接着基于观察数据和猜测的隐含数据一起来极大化对数似然，求解我们的模型参数（算法的步)。
由于我们之前的隐藏数据是猜测的，所以此时得到的模型参数一般还不是我们想要的结果。不过没关系，我们基于当前得到的模型参数，继续猜测隐含数据（ [Python嗯~机器学习]---EM算法的基本理解算法的步），然后继续极大化对数似然，求解我们的模型参数（算法的步)。以此类推，不断的迭代下去，直到模型分布参数基本无变化，算法收敛，找到合适的模型参数。

要学习 [Python嗯~机器学习]---EM算法的基本理解算法（最大期望算法），首先要了解的是极大似然估计。。。

1、极大似然估计

[Python嗯~机器学习]---EM算法的基本理解

总的来说：极大似然估计就是用来估计模型参数的统计学方法。

举个例子：
给定一组样本，并且他是高斯模型，怎么确定参数和？
[Python嗯~机器学习]---EM算法的基本理解
高斯分布的概率密度函数：

根据上面 MLE 得出的 [Python嗯~机器学习]---EM算法的基本理解
代入每一个的高斯概率结果得到

通过取 log 对数对上式进行化简：
[Python嗯~机器学习]---EM算法的基本理解

这时候我们得到目标函数：
[Python嗯~机器学习]---EM算法的基本理解
下面就是考虑如何调整和来使得目标函数最大。

与我们高斯模型矩估计结果一致。

那么，现在引入我们的话题，随机变量无法直接（完全）观察到，怎么办？
例如：
[Python嗯~机器学习]---EM算法的基本理解

高斯混合模型GMM

首先还是根据极大似然估计的理论建立目标函数：
[Python嗯~机器学习]---EM算法的基本理解
相当于每一个高斯模型的权重，总的到最后最大是。

也就是决定每个高斯模型的重要性。

EM算法

[Python嗯~机器学习]---EM算法的基本理解

取对数似然函数
[Python嗯~机器学习]---EM算法的基本理解

这时候引入 Jensen 不等式：

由于对数函数是凹函数，所以有： [Python嗯~机器学习]---EM算法的基本理解

[Python嗯~机器学习]---EM算法的基本理解为了寻找最大的下界，那么我们使上式中的等号成立：
（1）
进一步，由于是一种分布的概率，所以加和为：
（2）
由上式（1）和（2）得到：

所以，推到算法的过程：

如果，那么 [Python嗯~机器学习]---EM算法的基本理解就是我们隐藏数据对数似然的下界，那么就要极大化这个似然函数。

在固定参数后，使下界拉升的的计算公式，解决了如何选择的问题。这一步就是步，建立 C 的下界。接下来的 [Python嗯~机器学习]---EM算法的基本理解步，就是在给定后，调整，去极大化 V 的下界。

所以：
初始化分布参数 [Python嗯~机器学习]---EM算法的基本理解；重复以下步骤直到收敛：

1、 [Python嗯~机器学习]---EM算法的基本理解步骤：根据参数初始值或上一次迭代的模型参数来计算出隐性变量的后验概率，其实就是隐性变量的期望。作为隐藏变量的现估计值：

　　　　 [Python嗯~机器学习]---EM算法的基本理解

2、 [Python嗯~机器学习]---EM算法的基本理解步骤：将似然函数最大化以获得新的参数值：

　　　　 [Python嗯~机器学习]---EM算法的基本理解

EM的算法流程：

现在我们总结下 [Python嗯~机器学习]---EM算法的基本理解算法的流程。
输入：观察数据，联合分布 , 条件分布 , 最大迭代次数。

　　　　1) 随机初始化模型参数 [Python嗯~机器学习]---EM算法的基本理解的初值。

　　　　2） for j from 1 to [Python嗯~机器学习]---EM算法的基本理解开始算法迭代：

　　　　　　a) [Python嗯~机器学习]---EM算法的基本理解步：计算联合分布的条件概率期望：

[Python嗯~机器学习]---EM算法的基本理解

　　　　　　b) [Python嗯~机器学习]---EM算法的基本理解步：极大化 ,得到：

[Python嗯~机器学习]---EM算法的基本理解

　　　　　　c) 如果 [Python嗯~机器学习]---EM算法的基本理解已收敛，则算法结束。否则继续回到步骤 a) 进行步迭代。

　　　　输出：模型参数 [Python嗯~机器学习]---EM算法的基本理解。

最后，推导高斯混合模型

问题：
[Python嗯~机器学习]---EM算法的基本理解

步骤：
1、 [Python嗯~机器学习]---EM算法的基本理解步：

2、 [Python嗯~机器学习]---EM算法的基本理解步：
把多项分布和高斯分布的参数代入：

3、对均值求偏导：
[Python嗯~机器学习]---EM算法的基本理解

4、高斯分布均值：
令上式等于 0，解的均值为
[Python嗯~机器学习]---EM算法的基本理解

5、高斯分布的方差
求偏导，等于 0
[Python嗯~机器学习]---EM算法的基本理解

6、多项分布的参数
考察M-step的目标函数，对于 [Python嗯~机器学习]---EM算法的基本理解，删除常数项

得到

7、拉格朗日乘子法
由于多项分布的概率和为 [Python嗯~机器学习]---EM算法的基本理解，建立拉格朗日方程

注：这样求解的一定非负，所以，不用考虑这个条件

8、求偏导等于 0
[Python嗯~机器学习]---EM算法的基本理解

总结：

对于所有的数据点，可以看作组份 [Python嗯~机器学习]---EM算法的基本理解生成了这些点。组份是一个标准的高斯分布，利用上面的结论：

[Python嗯~机器学习]---EM算法的基本理解

相关文章：

2021-05-02
2021-10-14
2021-12-27
2021-04-12
2021-05-06
2021-05-18
2021-11-01

猜你喜欢

2021-12-06
2021-06-15
2021-11-13
2021-11-19
2021-06-17
2021-11-07

相关资源

下载 2023-03-23
下载 2021-07-01
下载 2021-06-06

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode