目录

概率与统计的关注点

概率统计与机器学习的关系​

重要统计量​

期望

方差

协方差

协方差的意义

协方差应用到机器学习中

Pearson相关系数

协方差矩阵

相关系数矩阵

再谈独立与不相关

统计参数的总结


 

概率与统计的关注点

七月算法机器学习2 数理统计与参数估计1

七月算法机器学习2 数理统计与参数估计1

概率统计与机器学习的关系
七月算法机器学习2 数理统计与参数估计1

七月算法机器学习2 数理统计与参数估计1

  1. 统计估计的是分布,机器学习训练出来的是模型,模型可能包含了很多分布。
  2. 训练与预测过程的一个核心评价指标就是模型的误差。
  3. 误差本身就可以是概率的形式,与概率紧密相关
  4. 对误差的不同定义方式就演化成了不同损失函数的定义方式。
  5. 机器学习是概率与统计的进阶版本。(不严谨的说法)
     

重要统计量
七月算法机器学习2 数理统计与参数估计1

期望

七月算法机器学习2 数理统计与参数估计1

期望可以理解为平均值或加权平均

七月算法机器学习2 数理统计与参数估计1

方差

七月算法机器学习2 数理统计与参数估计1

样本的离散程度

协方差

七月算法机器学习2 数理统计与参数估计1

评价两个随机变量的关系

七月算法机器学习2 数理统计与参数估计1

独立和不相关
 

协方差的意义

七月算法机器学习2 数理统计与参数估计1

协方差应用到机器学习中
 

两个特征是否相关

协方差可以用来降维

Cov(x, y) 只评估特征和标签的关系时如果=0,说明无关,可以直接不要了,降维

七月算法机器学习2 数理统计与参数估计1

七月算法机器学习2 数理统计与参数估计1

Pearson相关系数

七月算法机器学习2 数理统计与参数估计1

越近1越相关,如果样本非常大,则可以通过这个挑选

协方差矩阵

七月算法机器学习2 数理统计与参数估计1

七月算法机器学习2 数理统计与参数估计1

相关系数矩阵


七月算法机器学习2 数理统计与参数估计1

越红越负相关,越蓝越正相关,0则基本不相关

留下为0的,去掉红和蓝的相关一个样本

评价特征相关性的意义是筛选特征

 

特征1体积,特征2质量

如果两个是正相关,则我们可以只考虑一个特征就可以了

 

要尽可以用相互独立的特征

 

再谈独立与不相关

七月算法机器学习2 数理统计与参数估计1

七月算法机器学习2 数理统计与参数估计1

统计参数的总结

七月算法机器学习2 数理统计与参数估计1

 

 

 

 

相关文章:

  • 2022-02-08
  • 2021-11-15
  • 2021-05-17
  • 2021-09-29
  • 2022-02-06
  • 2019-03-10
  • 2021-10-20
  • 2021-04-04
猜你喜欢
  • 2021-04-03
  • 2021-07-19
  • 2021-10-04
  • 2022-12-23
  • 2021-12-08
  • 2021-09-02
  • 2021-12-12
相关资源
相似解决方案