001-线性回归

如果有一组样本

001-线性回归

要根据以后的x1，x2来预测以后未知的y

相当于拟合一个由θ1x1，θ2x2的平面hθ（x）来估计Y值

001-线性回归

001-线性回归

001-线性回归是偏置项

如果样本的特征无限增多，也就是x项有n多个

相当于

001-线性回归

令x0=1

则有

001-线性回归

001-线性回归

矩阵比较高效，需要转换为矩阵，则

化为矩阵：

001-线性回归

预测值和真实值之间必定存在误差

则设，误差为： 001-线性回归

则每个样本的实际值为： 001-线性回归

001-线性回归的概率密度服从正态分布，独立并且相同分布

均值为0，方差为 001-线性回归

001-线性回归

001-线性回归

则此处的μ为0， 001-线性回归

独立：每一组x的误差都与另外一组x的误差无关

相同分布：属于同一组数据或同一个作用域或x来自于同样一个地方的

因为 001-线性回归服从高斯分布

则：

001-线性回归

因为：

001-线性回归

则：

001-线性回归

似然函数：根据样本来估计参数值，也就是说，什么样的参数跟数据组合后恰好是真实值

目标是让 001-线性回归越小越好，也就是说，让真实值和估计值越接近越好，或者是真实值与估计值相同的概率越高越好

001-线性回归

累乘关系，为什么是累乘？

因为这里是要满足所有样本数据，相当于与的关系，

因为前面说，误差的均值是0，并且满足高斯分布，

那么高斯分布在均值处，概率最大，均为为0，误差为0

也就是说所有的误差分布的概率相乘之后，越大越好，对应的点就是误差为0

对数似然：为什么要取对数？因为加法比乘法简单

001-线性回归

因为：

001-线性回归

则可以化为：

001-线性回归

化简：

001-线性回归

001-线性回归

前面说过， 001-线性回归越大越好

则

001-线性回归可看做常数而且为正数

当

001-线性回归时

则让 001-线性回归最小

就可以有 001-线性回归最大

令 001-线性回归

称为最小二乘法

真实值减去预测值的函数，

这里也说明，真实值减去预测值越小越好，得到的误差最小的概率也就越大，

这里一直是概率问题，不是实际误差值

这里的θ，x，y都是矩阵

展开后化简为：

001-线性回归

这里矩阵X，y都是已知量

则对θ求偏导，导数为0时，有θ最小值

001-线性回归

001-线性回归

则

001-线性回归时

有θ最小值

X就是样本，Y也是样本

则可以求出θ

评估方法：

001-线性回归

残差平方和越小越好，也就是真实值和预测值越接近，

则 001-线性回归越接近1，就说明这个模型是越好的

数学不要过一遍，用到哪里去看哪里就行，过一遍也不一定全都能记住。

唐宇迪机器学习视频笔记——线性回归算法原理推导

相关文章：

猜你喜欢

2021-05-20
2022-01-15
2022-01-03
2022-12-23
2022-02-01
2021-12-05

相关资源

下载 2021-11-03
下载 2023-01-08
下载 2022-12-31
下载 2023-02-06

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode