平差之统计学基础

随机变量:随机变量就是你去估计一件事可能发生的结果,然后把这些结果都用数字表达出来.(自己的理解,非准确定义)
如果随机变量的值都可以逐个列举出来，则为离散型随机变量。如果随机变量X的取值无法逐个列举则为连续型变量。

对于离散的,一般用频率函数去描述.
绝对频率:就是一个特定的变量在总量中出现的次数.所有变量出现的次数的总数等于总量的数量.
$\begin{array}{c} f_{1}+f_{2}+f_{3}+\ldots+f_{n}=N \\ \sum f_{i}=N \end{array}$
相对频率函数
就是归一化,原来的绝对频数除以总量,就能得到相对频数,所有变量的相对频数相加等于1.
$h_{i}=h\left(x_{i}, \Delta_{x}\right)=\frac{k_{i}}{n} ,\mathrm{i}=1,2,3, \ldots, \mathrm{m}\\ \begin{array}{c} 0 \leq h\left(x_{i}, \Delta_{x}\right) \leq 1 \\ \sum_{i=1}^{m} h\left(x_{i}, \Delta_{x}\right)=\sum_{i=1}^{m} \frac{k_{i}}{n}=\frac{1}{n} \sum_{i=1}^{m} k_{i}=1 \end{array}$
累积频数:就是逐级累加.

概率函数里,离散的叫概率质量函数,连续的叫概率密度函数.

概率质量函数.
离散型随机变量的概率函数(分布律),一个值对应一个概率.
也就是随机变量在各个可能值上对应的概率,用直方图表示,区间概率直接几个点相加?

概率密度函数
描述某个点的的概率的函数(暂且这么想吧,虽然点的概率是零)
区间概率看面积的差.

分布函数
(出现的原因是不想知道某个特定的值的概率,只想知道在某个范围内的概率)
概率函数累加的结果
概率分布函数怎么求?
离散就分布函数纵坐标算出来相减
连续就看纵坐标差值,纵坐标相减的结果表示在某一区间取值的概率

分布函数的特性:
非降性
对于任意实数:
$x_{1}<x_{2}, F\left(x_{2}\right)-F\left(x_{1}\right)=P\left\{x_{1}<X<x_{2}\right\} \geq 0, F\left(x_{1}\right) \leq F\left(x_{2}\right)$
有界性
$0 \leq F(x) \leq 1 ; F(-\infty)=0, F(+\infty)=1$
右连续性
$F(x)=F(x+0)$

例子:
概率密度函数:
$f(x)=6 x-6 x^{2} \quad x \in[0,1]$
图像如下:
平差之统计学基础
求分布函数F(X),也就是求积分.
下限为负无穷, 上限为x.
计算不定积分时，你无法判断它的常数项，所以需要加C;
计算定积分时，因为给出积分上下限，可以得出它的常数项,不需要加C.
这里相当于求定积分,所以不加C.
$F(x)=\int_{-\infty}^{x} f(t) d t$
这里的F(x)是一个分段函数:
$F(x)=\left\{\begin{array}{cc} 0 & (x<0) \\ 3 x^{2}-2 x^{3} & (0 \leq x \leq 1) \\ 0 & (x>1) \end{array}\right.$

期望值
对于离散型随机变量,期望值就是把随机变量的每个取值与其对应的概率相乘,然后再把其相加.公式如下:
$\begin{array}{c} E(X)=\\X_{1} * p\left(X_{1}\right)+X_{2} * p\left(X_{2}\right)+\ldots+X_{n} * p\left(X_{n}\right)=\\X_{1} * f\left(X_{1}\right)+X_{2} * f\left(X_{2}\right)+\ldots+X_{n} * f\left(X_{n}\right) \\ E(X)=\sum_{k=1}^{\infty} x_{k} p_{k} \end{array}$

对于连续型随机变量,道理其实也是一样的,公式如下:
$E(X)=\mu=\int_{-\infty}^{\infty} x f(x) d x$
另外要注意区分期望和均值,期望是理论上的,你去预测的,均值是实实在在用观测值算出来的.
参见:
https://www.zhihu.com/question/25391960

这道题其实就是算一个[0,1]内的定积分.
$E(X)=\int_{0}^{1} x f(x) d x=0.5$
注意概率一般用小数表示哈.

方差
方差是一种特殊的期望,是随机变量的每个取值与其期望(均值)的差值的平方的期望.
$\sigma^{2}=E\left[(X-\mu)^{2}\right]\\ =E\left(X^{2}-2 \mu X+\mu^{2}\right)\\ =E\left(X^{2}\right)-2 \mu E(X)+\mu^{2}\\=E\left(X^{2}\right)-2\mu^{2}+\mu^{2}\\=E\left(X^{2}\right)-\mu^{2}$
用这个式子计算是因为(X- $\mu$ )没法求.
算下来等于 $\sqrt{0.05}$

标准差也很简单,就是方差开方取正.没啥特别的,主要是为了统一单位.

要求一个在x定义域外的概率,比如求 $P(x>1.1)$ ,就是0
要求一个在x定义域内的概率,对于连续型函数来说,比如 $P(x=0.35)$ ,也是0.
只有在定义域内求区间概率才有意义,比如求 $P(0 \leq x \leq 0.5)$ ,前面说过,对于连续型,就是求对应分布函数的F(X)的差,或者用概率密度函数求面积也行.
$P(0 \leq x \leq 0.5)=F(0.5)-F(0)=0.5$