学生t-分布(t-distribution)

  即T分布
  用于根据小样本来估计呈正态分布且方差未知的总体的均值。另外,如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。
  t分布曲线形态与n(确切地说与自由度df)大小有关。与标准正态分布曲线相比,自由度df越小,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度df愈大,t分布曲线愈接近正态分布曲线,当自由度df=∞时,t分布曲线为标准正态分布曲线。

图例

机器学习基础--math(12)--t分布
  上图是不同自由度下的t分布形状与正态分布对比。
其中自由度为1的t分布也称为柯西分布。自由度越大,t分布的形状越接近正态分布。
  从图中还可以看出,t分布比正态分布要“胖”一些,尤其在尾部两端较为平缓。t分布是一种典型的长尾分布。实际上,在稳定分布家族中,除了正态分布,其他均为长尾分布。长尾分布有什么好处呢?在处理小样本和一些异常点的时候作用就突显出来了。

  对于曲线上的点,当样本数量n=5时,则自由度df=4,我们就可以查找表中(或者看分布图像)以4开头的行。该行第5列值为2.132,对应的单侧值为95%(双侧值为90%)。这也就是说,T小于2.132的概率为95%(即单侧),记为Pr(−∞ < T < 2.132) = 0.95;同时,T值介于-2.132和2.132之间的概率为90%(即双侧),记为Pr(−2.132 < T < 2.132) = 0.9。

相关文章:

  • 2021-07-15
  • 2021-12-15
  • 2021-09-14
  • 2022-12-23
  • 2021-08-28
  • 2021-12-19
  • 2021-12-26
  • 2021-11-05
猜你喜欢
  • 2021-09-26
  • 2021-12-17
  • 2021-11-14
  • 2021-08-17
  • 2021-07-27
  • 2021-09-24
  • 2021-10-07
相关资源
相似解决方案