在一般的数学统计过程中,为了求得方差,需要预先知道所有的数据项,然后通过求均值,再通过遍历所有数据项计算平方和的方式求得方差。
但是在大数据、流式处理的场景,是无法预先知道所有数据项的,经常需要在任意时候动态的知道当前所有存量数据的方差,此时如果使用遍历的方式,将耗费大量的计算量,同时,缓存所有的数据也占用大量存储空间。
所以需要通过递推的方式,通过之前状态的均值、方差、计数、以及当前数据项来计算出当前状态的方差。

方差递推公式的计算过程如下:
整个推导过程是用word结合MathType写的,复制到markdown上来太闹心了,直接截图了。
PS:程序员,不是数学系的,推导过程自己看着好像没啥问题,有错误欢迎指正
均值递推和方差递推公式

相关文章:

  • 2021-09-05
  • 2021-12-17
  • 2021-06-26
  • 2021-12-12
  • 2022-12-23
  • 2021-07-19
  • 2021-08-23
猜你喜欢
  • 2022-12-23
  • 2021-08-23
  • 2022-02-01
  • 2022-12-23
  • 2021-11-05
  • 2021-08-19
  • 2022-12-23
相关资源
相似解决方案