一、线性回归

给定一组数据(xi,yi)(x_{i},y_{i})yiy_{i}是连续的,用线性模型y^i=hθ(xi)=θTxi\hat{y}_{i}=h_{\theta}(x_{i})=\theta^{T}x_{i},估计值y^i\hat{y}_{i}与实际值yiy_{i}间存在误差εi\varepsilon_{i},即
yi=θTxi+εi(1)y_{i}=\theta^{T}x_{i}+\varepsilon_{i}(1).
误差εi\varepsilon_{i}属于独立同分布的,根据大数定理,εiμ(0,σ2)\varepsilon_{i} \sim\mu(0,\sigma^{2}),则有:
p(εi)=12πeεi2σ2(2)p(\varepsilon_{i} ) = \frac{1}{\sqrt{2\pi}}e^{-\frac{\varepsilon_{i}^{2}}{\sigma^{2}}}(2)
εi=yiθTxi\varepsilon_{i}=y_{i}-\theta^{T}x_{i}带入(2)式有,
p(yixi,θ)=12πe(yiθTxi)2σ2(3)p(y_{i}|x_{i},\theta ) =\frac{1}{\sqrt{2\pi}}e^{-\frac{(y_{i}-\theta^{T}x_{i})^{2}}{\sigma^{2}}} (3)
转成了xi,θx_{i},\theta已知的情况下,yiy_{i}发生的概率。
最大似然函数为
L(θ)=Πi=1mp(yixi,θ)(4)L(\theta)=\Pi_{i=1}^{m}p(y_{i}|x_{i},\theta )(4)
将(3)式带入(4)中,然后取对数,最后得到
J(θ)=12Σi=1m(hθ(xi)yi)2=12(θTXY)T(θTXY)J(\theta)=\frac{1}{2}\Sigma_{i=1}^{m}(h_{\theta}(x_{i})-y_{i})^{2}=\frac{1}{2}(\theta^{T}X-Y)^{T}(\theta^{T}X-Y)
通过最小二乘法,求出参数θ\theta

方法二:最小均方误差(整体误差的平方和最小,几何方法)
cost(θ)=min12Σi=1m(hθ(xi)yi)2(5)=min12(θTXY)T(θTXY)cost(\theta)=min{\frac{1}{2}\Sigma_{i=1}^{m}(h_{\theta}(x_{i})-y_{i})^{2}} (5)=min{\frac{1}{2}(\theta^{T}X-Y)^{T}(\theta^{T}X-Y)}
为了求(5)式的最小值,由于cost(θ)>=0cost(\theta)>=0,对θ\theta求导,导数为0的点记为参数θ\theta的值,即可得出线性模型y^i=hθ(xi)=θTxi\hat{y}_{i}=h_{\theta}(x_{i})=\theta^{T}x_{i}

机器学习算法(一)
机器学习算法(一)
XTXX^{T}X中加入了λ\lambda后,带入J(θ)J(\theta)中,
机器学习算法(一)

机器学习算法(一)

二、通过交叉验证选取超参数

三、梯度下降算法

相关文章:

  • 2021-05-05
  • 2021-08-31
  • 2021-04-12
  • 2021-12-23
  • 2021-10-16
  • 2022-03-02
  • 2022-12-23
  • 2021-08-07
猜你喜欢
  • 2022-12-23
  • 2021-08-13
  • 2021-12-15
  • 2021-09-08
  • 2022-02-13
相关资源
相似解决方案