《数学之美（第一版）》笔记 —— 第5章

第5章隐含马尔科夫模型

通信模型

通信的六要素：发送者，信道，接受者，信息，上下文，编码。
问题：如何从接收端的观测信号 $o_1,o_2,o_3...$ 来推测信号源发送的信息 $s_1,s_2,s_3...$ ？

解：找最可能产生观测信号的源信息。

由于 $o_1,o_2,o_3...$ 一旦产生就不会改变，所以此时 $P(o_1,o_2,o_3,...)$ 就是一个可以忽略的常数。因此，上面的公式可以等价成为： $P(o_1,o_2,o_3,...|s_1,s_2,s_3,...)*P(s_1,s_2,s_3,...)$

而这个公式可以使用隐含马尔可夫链模型来估计。

隐含马尔科夫模型

马尔科夫假设：随机过程中各个状态 $s_t$ 的概率分布只与它的前一个状态 $s_{t-1}$ 有关，即 $P(s_t|s_1,s_2,s_3,...s_{t-1})=P(s_t|s_{t-1})$
马尔科夫链：符合马尔科夫假设的随机过程称为马尔科夫过程**，也称为马尔科夫链。一个离散的马尔科夫过程如下所示：

《数学之美（第一版）》笔记 —— 第5章

隐含马尔科夫模型：是马尔科夫链的一个扩展：任一时刻 $t$ 的状态 $s_t$ 都是不可见的。所以观察者没办法通过观察到一个状态序列 $s_1,s_2,s_3,...s_T$ 来推测转移概率等参数。但是，隐含马尔科夫模型在每个时刻 $t$ 会输出一个符号 $o_t$ ，而且 $o_t$ 和 $s_t$ 相关且仅和 $s_t$ 相关。这个被称为独立输出假设。隐含马尔科夫模型如下：
和通信解码问题的联系：

上文提到的通信解码公式： $P(o_1,o_2,o_3,...|s_1,s_2,s_3,...)*P(s_1,s_2,s_3,...)$

和公式（5,4）非常像，可以做以下变换进行等价：

《数学之美（第一版）》笔记 —— 第5章

这样子便可以使用隐含马尔科夫模型来解决。找到式子的最大值，进而找出要识别的句子 $s_1, s_2, s_3, ...,$ 可以利用维特比算法。

关于隐含马尔科夫模型的训练

一些定义：
有监督的训练方法：直接根据语料估计模型的参数。
无监督训练方法：通过大量观测到的信号 $o_1,o_2,o_3,...$ 就能推算模型的参数 $P(s_t|s_{t-1})$ 和 $P(o_t|s_t)$ 。主要是使用鲍姆-韦尔奇算法。其思想如下：

补充：

这一章涉及的内容其实非常难，可以深挖。推荐这个博主的内容：

https://www.cnblogs.com/pinard/p/6945257.html

包含了1）隐含马尔科夫模型介绍；2）前向后向算法；3）鲍姆-韦尔奇算法；4）维特比算法。

非常推荐！！

相关文章：

猜你喜欢

相关资源

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode