与多项式回归的对比:多项式基函数的缺点,详细以后再补存

常用基函数

3.1.1 Maximum likelihood and least squares

与GMM的区别:单峰的而GMM是多峰的

多个数据此时下标表示样本个数

高斯噪声、线性模型最大化似然等价于最小化MSE

一点点简单的证明
f=wTϕ(xn)df=(dw)Tϕ(xn)df=tr((dw)Tϕ(xn))df=tr(ϕ(xn)Tdw)∂w∂f=ϕ(xn)
标量对列向量的求导还是列向量,因此书中不是转置(写成行向量求导更容易)

书中统一将导数转化为行向量,可以使得计算w方便,如下示

就以列向量进行推导
0=n=1∑Ntnϕ(xn)−n=1∑NwTϕ(xn)ϕ(xn)0=n=1∑Ntnϕ(xn)−n=1∑Nϕ(xn)wTϕ(xn)0=n=1∑Ntnϕ(xn)−n=1∑Nϕ(xn)ϕ(xn)Tw
第一项是ΦTt,第二项是ΦTΦw
方差的估计值

线性基函数模型中w0权重的意义:
