一、什么是参数估计
参数通常用来表示一个量,可以是标量也可以是有值向量。按照时间变化,也可以分为时常参数和时变参数。对于时常参数的估计称为参数估计。对于时变的参数估计称为状态估计,本文不研究。参数估计的包括两个主要的模型以及四个基本估计方法,如下图所示:
贝叶斯学派和频率学派最大的不同、根上的不同,就是在于模型 y=wx+b 其中的 w 和 b 两个参数,频率学派认为参数是固定的、也就是上面的非随机模型,只要通过不停的采样、不停的观测训练,就能够估算参数 w 和 b,因为它们是固定不变的;而贝叶斯学派相反,他们认为这些参数是变量,它们是服从一定的分布的,也就是上面的随机模型,这是它最根本的差别。通常上面两种也被称为点估计和区间估计。
二、四种基本的估计方法
来自《雷达数据处理及应用》
2.1 最大似然估计
2.2 最小二乘估计
2.3 最大后验估计
2.4 最小均方误差估计
三、最大似然估计和最小二乘估计的对比
当模型是高斯分布时,最大似然估计和最小二乘估计是等价的。
四、基础知识
均方误差,MSE(mean squared error),是预测值与真实值之差的平方和的平均值,即:
均方误差可用来作为衡量预测结果的一个指标
均方差,也叫标准差(Standard Deviation),是方差的算术平方根。而方差是样本实际值与实际值的总体平均值之差的平方和的平均值。
方差:
均方差:
五、改进卡尔曼滤波
作为线性的解码器,Kalman Filter确实能找到观测变量和测量变量之间的关系,并用观测变量去纠正当前测量变量中的误差。但是涉及到非线性关系的时候,Kalman Filter的线性假设就不成立了。这时有两种优化的方法:
1、如果已知这种非线性关系的公式,例如加速度和位置的关系等,那么可以把上述转换模型和观测模型换成已知的非线性模型,增加解码准确率。这种方法就是扩展卡尔曼滤波(Extend Kalman Filter)。这种方法的优点在于拟合更加准确,但是缺点也很明显。首先是计算量增加,如果非线性拟合涉及很复杂的模型,那么计算量比Kalman Filter增加很多。然后是非线性模型,并不是任何时候,这种模型都是已知的,如果不是已知的,那就需要进行非线性拟合,找到最合适的拟合模型,例如指数模型,高阶模型等,再次增加计算量。
2、如果不知道这种非线性关系的公式,那么我们可以进行非线性拟合或者直接假设一个公式。但是我们观察Kalman Filter的计算过程,整个估计过程中,用到了当前时刻的值,以及协方差。而这两个量,我们是能通过采样的方式得到的,即,可以不需要直接计算非线性模型的协方差矩阵,直接通过采样估计,类似蒙特卡洛的方法。但是采样的计算量会更大,因为需要大样本才能得到准确的估计。目前有另外一种办法,能够用很少的采样点(几个)就得到准确的估计,这种方法是无迹变换(Unscented Transform),结合到Kalman Filter中,就是无迹卡尔曼滤波(Unscented Kalman Filter)。
无迹卡尔曼滤波(Unscented Kalman Filter)。无迹卡尔曼滤波是对卡尔曼滤波的一种改进。这种改进主要是针对非线性的信号。因为在卡尔曼滤波中,预测模型以及测量空间对应的转换矩阵都是都是线性转换。但是在面对非线性信号时,会出现无法拟合的情况。所以就有了无迹卡尔曼滤波。这种方法的主要改进在于,不再用线性的模型去计算预测模型以及转换矩阵,而是通过采样和计算均值方法的方式,去估计样本的方差和均值。