内容主要提取自 edX 平台上Chalmers的micromaster项目:Emerging Automotive Technologies: Sensor Fusion and Non-linear Filtering for Automotive Systems。
1、频率学派与贝叶斯学派
(来自维基百科)在频率学派的推断方法中,未知参数通常(但不总是)被视为具有固定但未知的值,这些值在任何意义上都不能被视为随机变量,因此概率无法与它们相关联。相反,贝叶斯推断方法允许概率与未知参数相关联。
个人理解:在频率学派观点中,未知参数是定值,因此推断过程相当于求未知数的过程,例如极大似然估计,就是求解一个未知参数的值使得概率(频率)最大;在贝叶斯学派观点中,未知参数既然是未知的,其取值只能是服从某种条件概率分布(后验概率),最后得到的结果是概率分布,并在此基础上,可以根据定义的损失函数,如Minimum mean squared error estimator(MMSE)最小均方差估计,Maximum a-posteriori estimator(MAP)最大后验估计等,确定一个未知参数的值。以投一枚公平的硬币为例,对于频率学派,当硬币落地后,硬币的状态是正面还是反面是确定的,只不过我们不知道;对于贝叶斯学派,如果我们没有看到结果(无附加信息,如果有其他信息,比如看到了硬币的一部分,那么概率分布就会发生变化),那么硬币既是正面也是反面,正反的可能性都为0.5(突然想到薛定谔的猫)。
无论如何,不同学派的观点是不同学派理论的出发点,就像力学中的质点假设,刚体假设等一样,如要运用,就要接受之。
2、 贝叶斯滤波:模型假设
马尔科夫过程:马尔可夫过程的条件概率仅仅与系统的当前状态相关,而与它的过去历史或未来状态,都是独立、不相关的。也可以理解为,当预测 时,
所提供的信息最多,其他诸如
,
,
等并不能提供更多有效信息。当
已知时,
和
是条件独立的。
上述模型可表示为如下的贝叶斯网络(信念网络):
3、 贝叶斯滤波:推导
贝叶斯滤波过程可以总结:
即在已知过去的一系列观测,以及当前状态的观测时,求当前状态(的概率分布)。
运用递归的方式求解:
第一步:预测。从 求
第二步:更新。从 求
。利用当前的观测信息校正预测。
其中:
因为 和
都是已知的确定值,所以
是常数。由:
求得 。
重复上述两步,在给定 或
的条件下,即可求得任意
。