目录
https://blog.csdn.net/weixin_45792450/article/details/109314584
常用统计分布
前面已指出,当取得总体 X {X} X的样本 ( X 1 , X 2 , . . . , X n ) ({X_1},{X_2},...,{X_n}) (X1,X2,...,Xn)后,通常是借助样本的统计量对未知的总体分布进行推断的。
为了实现推断的目的必须进一步确定相应的统计量所服从的分布,这样就有必要补充一些在概率论部分中未曾提及但在统计学中经常用到的分布主要为三种分布: χ 2 {\chi ^2} χ2分布、 F {F} F分布与 t {t} t分布。
鉴于这些分布在统计学中的重要性,通常统称其为常用统计分布。
分位数
分位数是统计推断中经常用到的一类数字特征,在熟悉其概念与性质后可对一些统计分布表进行查表使用。
定义:设随机变量 X {X} X的分布函数为 F ( x ) {F(x)} F(x),对给定的实数 α ( 0 < α < 1 ) \alpha (0 < \alpha < 1) α(0<α<1),如果实数 F α {F_\alpha } Fα满足: P ( X > F α ) = α P(X > {F_\alpha }) = \alpha P(X>Fα)=α,则称 F α {F_\alpha } Fα为随机变量 X {X} X的分布的水平 α \alpha α的上侧分位数,或直接称为分布函数 F ( x ) {F(x)} F(x)的水平 α \alpha α的上侧分位数
举例说明:如下图为分布函数 F ( x ) {F(x)} F(x)的水平 α \alpha α的上侧分位数示意图
显然,有性质: 1 − F ( F α ) = α , F ( F α ) = 1 − α 1 - F({F_\alpha }) = \alpha ,F({F_\alpha }) = 1 - \alpha 1−F(Fα)=α,F(Fα)=1−α
对于像标准正态分布那样的对称分布(即其密度函数为偶函数,关于y轴对称),统计学中还用到其另一种分位数——双侧分位数。
定义:设 X {X} X是对称分布的连续型随机变量,其分布函数为 F ( x ) {F(x)} F(x),对给定的实数 α ( 0 < α < 1 ) \alpha (0 < \alpha < 1) α(0<α<1),如果实数 T α {T_\alpha } Tα满足: P ( ∣ X ∣ > T α ) = α P(\left| X \right| > {T_\alpha }) = \alpha P(∣X∣>Tα)=α,则称 T α {T_\alpha } Tα为随机变量 X {X} X的分布的水平 α \alpha α的双侧分位数,或直接称为分布函数 F ( x ) {F(x)} F(x)的水平 α \alpha α的分位数
例题:
χ 2 {\chi ^2} χ2分布
定义:设随机变量 X 1 , X 2 , . . . , X n {X_1},{X_2},...,{X_n} X1,X2,...,Xn相互独立且均服从标准正态分布 N ( 0 , 1 ) N(0,1) N(0,1),则称随机变量 χ 2 = X 1 2 + X 2 2 + . . . + X n 2 {\chi ^2} = X_1^2 + X_2^2 + ... + X_n^2 χ2=X12+X22+...+Xn2服从自由度为n的 χ 2 {\chi ^2} χ2分布,记作 χ 2 ∼ χ 2 ( n ) {\chi ^2} \sim {\chi ^2}(n) χ2∼χ2(n)
注:该分布中文读作卡方分布
χ 2 {\chi ^2} χ2分布性质
-
设 χ 2 ∼ χ 2 ( n ) {\chi ^2} \sim {\chi ^2}(n) χ2∼χ2(n),对给定的 α ( 0 < α < 1 ) \alpha (0 < \alpha < 1) α(0<α<1),其上$\alpha 分 位 如 下 : 分位如下: 分位如下: P ( χ 2 > χ α 2 ( n ) ) = ∫ χ α 2 ( n ) + ∞ f ( x ) d x P\left( {{\chi ^2} > \chi _\alpha ^2(n)} \right) = \int_{\chi _\alpha ^2(n)}^{ + \infty } {f(x)dx} P(χ2>χα2(n))=∫χα2(n)+∞f(x)dx$
-
设 χ 1 2 ∼ χ 2 ( n 1 ) \chi _1^2 \sim {\chi ^2}({n_1}) χ12∼χ2(n1), χ 2 2 ∼ χ 2 ( n 2 ) \chi _2^2 \sim {\chi ^2}({n_2}) χ22∼χ2(n2),且 χ 1 2 \chi _1^2 χ12与 χ 2 2 \chi _2^2 χ22相互独立,则 χ 1 2 + χ 2 2 ∼ χ 2 ( n 1 + n 2 ) \chi _1^2 + \chi _2^2 \sim {\chi ^2}({n_1} + {n_2}) χ12+χ22∼χ2(n1+n2)
-
设 χ 2 ∼ χ 2 ( n ) {\chi ^2} \sim {\chi ^2}(n) χ2∼χ2(n),则 E ( χ 2 ) = n , D ( χ 2 ) = 2 n {E({\chi ^2}) = n,D({\chi ^2}) = 2n} E(χ2)=n,D(χ2)=2n
对1和2性质,由概率论知识就直接得出了,十分显然。现在来证明3:
证明:
E ( χ 2 ) = E ( X 1 2 + X 2 2 + . . . + X n 2 ) {E({\chi ^2}) = E(X_1^2 + X_2^2 + ... + X_n^2)} E(χ2)=E(X12+X22+...+Xn2)
= E ( X 1 2 ) + E ( X 2 2 ) + . . . + E ( X n 2 ) { = E(X_1^2) + E(X_2^2) + ... + E(X_n^2)} =E(X12)+E(X22)+...+E(Xn2)
= n E ( X 2 ) { = nE(X_{}^2)} =nE(X2)
= n ( D ( X ) + E 2 ( X ) ) = n { = n\left( {D(X) + {E^2}(X)} \right) = n} =n(D(X)+E2(X))=n
D ( χ 2 ) = D ( X 1 2 + X 2 2 + . . . + X n 2 ) D({\chi ^2}) = D(X_1^2 + X_2^2 + ... + X_n^2) D(χ2)=D(X12+X22+...+Xn2)
= D ( X 1 2 ) + D ( X 2 2 ) + . . . + D ( X n 2 ) = D(X_1^2) + D(X_2^2) + ... + D(X_n^2) =D(X12)+D(X22)+...+D(Xn2)
= n D ( X 2 ) = n ( E ( X 4 ) − E 2 ( X 2 ) ) = nD(X_{}^2) = n\left( {E({X^4}) - {E^2}({X^2})} \right) =nD(X2)=n(E(X4)−E2(X2))
= n ( 3 − 1 ) = 2 n = n(3 - 1) = 2n =n(3−1)=2n
F F F分布
定义:设随机变量 X X X和 Y Y Y相互独立,且 X ∼ χ 2 ( n 1 ) , Y ∼ χ 2 ( n 2 ) X \sim {\chi ^2}({n_1}),Y \sim {\chi ^2}({n_2}) X∼χ2(n1),Y∼χ2(n2),则称随机变量 F = X / n 1 Y / n 2 F = {{X/{n_1}} \over {Y/{n_2}}} F=Y/n2X/n1服从自由度为 ( n 1 , n 2 ) ({n_1},{n_2}) (n1,n2)的 F F F分布,记作 F ∼ F ( n 1 , n 2 ) F \sim F({n_1},{n_2}) F∼F(n1,n2)
F F F分布性质
-
设 F ∼ F ( n 1 , n 2 ) F \sim F({n_1},{n_2}) F∼F(n1,n2),对给定的 α ( 0 < α < 1 ) \alpha (0 < \alpha < 1) α(0<α<1),其上$\alpha 分 位 如 下 : 分位如下: 分位如下: P ( F > F α ( n 1 , n 2 ) ) = ∫ F α ( n 1 , n 2 ) + ∞ f ( x ) d x P\left( {F > {F_\alpha }({n_1},{n_2})} \right) = \int_{{F_\alpha }({n_1},{n_2})}^{ + \infty } {f(x)dx} P(F>Fα(n1,n2))=∫Fα(n1,n2)+∞f(x)dx$
-
设 F ∼ F ( n 1 , n 2 ) F \sim F({n_1},{n_2}) F∼F(n1,n2),则 1 F ∼ F ( n 2 , n 1 ) {1 \over F} \sim F({n_2},{n_1}) F1∼F(n2,n1),且有 F α ( n 1 , n 2 ) = 1 F 1 − α ( n 2 , n 1 ) {F_\alpha }({n_1},{n_2}) = {1 \over {{F_{1 - \alpha }}({n_2},{n_1})}} Fα(n1,n2)=F1−α(n2,n1)1
证明:
由于 1 F ∼ F ( n 2 , n 1 ) {1 \over F} \sim F({n_2},{n_1}) F1∼F(n2,n1),按上侧分位数的定义,变换后应把$\alpha $置为$1-\alpha $,而不是下面错误的做法:
F α ( n 1 , n 2 ) = 1 F α ( n 2 , n 1 ) {F_\alpha }({n_1},{n_2}) = {1 \over {{F_\alpha }({n_2},{n_1})}} Fα(n1,n2)=Fα(n2,n1)1
对此的解释与理解可参考下例:
设随机变量 X ∼ U ( 1 10 , 10 ) X \sim U({1 \over {10}},10) X∼U(101,10),根据均匀分布的性质, X X X的密度函数为 f ( x ) = 10 99 f(x) = {{10} \over {99}} f(x)=9910
令随机变量 Y = 1 X Y = {1 \over X} Y=X1,显然:对 y ∈ ( 1 , 10 ) , x ∈ ( 1 / 10 , 1 ) y \in (1,10),x \in (1/10,1) y∈(1,10),x∈(1/10,1),此时若计算上侧分位数 α \alpha α,显然有: X α = 1 Y 1 − α {X_\alpha } = {1 \over {{Y_{1 - \alpha }}}} Xα=Y1−α1
可以用密度函数计算验证此等式以获得初步理解,本质上是坐标轴以 x = 1 x=1 x=1进行了变换
t t t分布
定义:设随机变量 X X X和 Y Y Y相互独立,且 X ∼ N ( 0 , 1 ) , Y ∼ χ 2 ( n ) X \sim N(0,1),Y \sim {\chi ^2}(n) X∼N(0,1),Y∼χ2(n),则称随机变量 T = X Y / n T = {X \over {\sqrt {Y/n} }} T=Y/n X服从自由度为 n n n的 t t t分布,记作 T ∼ t ( n ) T \sim t(n) T∼t(n)
t t t分布性质
-
设 T ∼ t ( n ) T \sim t(n) T∼t(n),对给定的 α ( 0 < α < 1 ) \alpha (0 < \alpha < 1) α(0<α<1),其上 α \alpha α分位如下: P ( T > t α ( n ) ) = ∫ t α ( n ) + ∞ f ( x ) d x P\left( {T > {t_\alpha }(n)} \right) = \int_{{t_\alpha }(n)}^{ + \infty } {f(x)dx} P(T>tα(n))=∫tα(n)+∞f(x)dx
-
t t t分布的概率密度函数 f ( x ) f(x) f(x)是偶函数,即 f ( x ) = f ( − x ) f(x)=f(-x) f(x)=f(−x),且当 n n n充分大时, t ( n ) t(n) t(n)分布近似于 N ( 0 , 1 ) N(0,1) N(0,1)
-
设 T ∼ t ( n ) T \sim t(n) T∼t(n),对给定的 α ( 0 < α < 1 ) \alpha (0 < \alpha < 1) α(0<α<1),其存在双侧 α \alpha α分位, t α ( n ) = − t 1 − α ( n ) {{t_\alpha }(n) = - {t_{1 - \alpha }}(n)} tα(n)=−t1−α(n)
注:结论2实质上利用了概率论的中心极限定理