-
随机变量:
假如一个变量在数轴上的取值依赖于随机现象的基本结果,则称此变量为随机变量.
-
累计概率分布函数(分布函数): F(x)=P(X⩽x)
-
可列可加性公理:
P(n=1⋃∞An)=n=1∑∞P(An)
-
二项分布的期望:X∼b(n,p)
E(X)=x=0∑nxCnxpx(1−p)n−x=np
-
泊松定理:在n重伯努利试验中,以pn表示在一次实验中成功发生的概率.且随着n增大,pn在减小.若n→∞时,λn=npn→λ,λ>0.则出现x次成功的概率为
Cnxpnx(1−pn)n−x→x!λxe−λ
证明:
(nx)pnx(1−pn)n−x=x!n(n−1)⋯(n−x+1)(nλn)x(1−nλn)n−x=x!λnx(1−n1)(1−n2)⋯(1−nx−1)(1−nλn)n−x
注意,又因为下面的极限成立
limn→∞λn=λlimn→∞(1−nλn)n−x=e−λ
所以原式成立.值得注意的是,这个分布和二项分布不同之处在于,pn是会变化的.它会取极限.
-
泊松分布:根据泊松定理可得 X∼P(λ)
x=1∑∞x!λxe−λ=eλx=1∑∞x!λx=e−λeλ=1
可见泊松定理推出的一个分布公式,实际上是一个概率分布.这个概率分布是一个典型的离散型分布.随机变量取值为所有非负整数.
-
泊松分布的期望:
E(X)=x=0∑∞x⋅x!λxe−λ=λe−λx=1∑∞(x−1)!λx−1=λ
-
泊松分布,总与计数过程相关联,并且计数是在一定时间内或一定区域内,或特定单位内的前提下进行的.比如
-
在一定时间内,电话总站接错电话的次数;
-
在一定时间内, 在超市排队等候付款的顾客人数;
-
在一定时间内,来到车站等候公共汽车的人数;
-
在一定时间内, 某操作系统发生故障的次数;
-
在一个稳定的团体内,活到100岁的人数;
-
一匹布上,瑕疵点的个数;
-
100页书上,错别字的个数;
-
一个面包上,葡萄干的个数;
-
超几何分布:N个产品,其中M个次品.如果进行不放回抽样.那么如果抽n次,拿到次品数量的概率分布.h(n,N,M)
P(X=x)=(Nn)(Mx)(N−Mn−x)x=0,1,⋯,r
其中r=min(n,M),其中我们可以看到的是
x=0∑r(Mx)(N−Mn−x)=(Nn)
由此可见 x=0∑rP(X=x)=1
-
连续随机变量的概率密度函数 p(x)⩾0
∫−∞+∞p(x)dx=1
P(a⩽X⩽b)=∫abp(x)dx
-
均匀分布 X∼U(a,b)
-
指数分布 X∼Exp(λ)
p(x)={λe−λx,x⩾00,x<0 不少产品首次发生故障的时间T服从指数分布.
-
随机变量的分布函数
F(x)=P(X⩽x)=∫−∞xp(x)dx
-
均匀分布 F(x)=⎩⎪⎪⎪⎨⎪⎪⎪⎧0b−ax−a1,x<a,a⩽x⩽b,x>b
-
指数分布 F(x)={01−e−λx,x<0,x⩾0
-
连续随机变量分布函数的一些性质
-
F(x)是连续函数
-
P(X=x)=0,零概率事件和不可能事件Φ,是有差别的.0️零概率事件不全是不可能事件.同理必然事件的概率为1.但是概率为1的事件不全是必然事件.概率为1的事件实际上是几乎必然发生的事件.
-
P(a⩽X⩽b)=P(a⩽X<b)=P(a<X⩽b)=P(a<X<b)
-
F′(x)=p(x)
-
P(x;p1(x)=p2(x))=1, 两个函数在概率论中成为几乎处处相等.比如
p1(x)={b−a1,0a<x⩽b, other
p2(x)={b−a1,0a<x<bother,
-
已知随即变量X的分布函数FX(x)和密度函数为pX(x),又设Y=g(x),其中g是严格单调的函数.且导数g′(⋅)存在.则Y的概率密度函数为
pY(y)=pX(h(y))∣h′(y)∣ h(y) 是
y=g(x)的反函数,h′(y)是其导数.
证明:
FY(y)pY(y)=P(Y⩽y)=P(g(X)⩽y)=P(X⩽h(y))=FX(h(y))=pX(h(y))⋅h′(y)
-
均匀分布的数学期望 E(x)=2a+b
-
指数分布的期望 E(X)=λ1
-
期望不存在的分布举例.柯西分布
p(x)=π(1+x2)1,−∞<x<∞ 因为积分,
π1∫−∞∞1+x2∣x∣dx 无限.
-
正态分布
p(x)=2πσ1Exp(−2σ2(x−μ)2),−∞<x<∞
-
正态分布的例子描述
-
正态分布的应用:
-
正态分布的期望 E(x)=μ
-
标准正态分布
φ(u)=2π1Exp(−2u2),−∞<u<∞.
Φ(u)=2π1∫−∞uExp(−2x2)dx
Φ(−u)=1−Φ(u)
-
正态分布的线性变换
X∼N(μ,σ2)→U=σX−μ
-
正态分布的计算
F(a<X<b)=Φ(σb−μ)−Φ(σa−μ)
P(X<b)=Φ(σb−μ)
P(X>a)=1−Φ(σa−μ)
-
伽马函数如下所示
Γ(α)=∫0∞xα−1e−xdx,α>0
-
Γ(1)=1,Γ(21)=π
-
Γ(α+1)=αΓ(α),对于自然数有Γ(n+1)=n!
-
∫0∞xα−1e−λxdx=Γ(α)/λα
-
伽马分布的概率密度函数,X∼Ga(α,λ) p(x)=⎩⎪⎨⎪⎧Γ(α)λαxα−1eλx0,x>0,x⩽0 其中α>0称为形状参数,λ>0称为尺度函数.
-
伽马分布的数学期望为 E(x)=λα
-
α=1的伽马分布就是指数分布.
-
指数分布X∼Exp(λ)无记忆性 P(X>s+t∣X>s)=P(X>t)
-
λ=21,
α=2n的伽马分布称为自由度为n的χ2分布.X∼χ2
E(x)=n=λα
p(x)=Γ(2n)2n/21x2n−1e−2x,x>0
-
贝塔函数
β(a,b)=∫01fdxxn−1(1−x)b−1dx,a>0,b>0
-
β(a,b)=β(b,a)
-
β(a,b)=Γ(a+b)Γ(a)Γ(b)
-
贝塔分布的,概率密度函数,X∼Be(a,b)
p(x)=Γ(a)Γ(b)Γ(a+b)xa−1(1−x)b−1,0⩽x⩽1
其中a,b都是形状参数,且都为正.
-
不合格率,服从它
-
机器维修率
-
打靶命中率
-
市场占有率
也就是说各种比率,的话.它们一般服从beta分布.
-
beta分布的数学期望 E(x)=a+ba
-
a=b=1的beta分布实际上就是[0,1]上的均匀分布.
-
设随机变量X以及其函数g(X)的数学期望都存在.那么 E[g(X)]=⎩⎪⎪⎪⎨⎪⎪⎪⎧i∑g(xi)p(xi)∫−∞∞g(x)p(x)dx
-
E[cg(X)]=cE[g(X)]
-
E[g(X)±h(X)]=E[g(X)]±E[h(X)]
-
E[c]=c
-
方差的定义Var[X]=E[X−E(X)]2,标准差Var[X]
-
Var[c]=0
-
Var[aX+b]=a2Var[X]
-
Var[X]=E(X2)−E[X]2
-
二项分布b(n,p)的方差为np(1−p)
-
均匀分布的方差为(b−a)2/12
-
伽马分布的方差为α/λ2
-
α=1,Y∼Exp(λ),E(Y)=λ−1,Var[Y]=λ−2,σ[X]=−λ
-
α=2n,λ=21,Z∼χ2(n),
E[Z]=n,Var[Z]=2n
-
切比雪夫不等式
P(∣X−E[X]∣⩾ϵ)⩽ϵ2Var[X]
-
这个不等式对于连续或者离散的都成立.
-
这个等式是描述概率曲线两端的和小于某个值.

-
方差为0的随机斌量X必几乎处处为常数.这个常数就是其期望E(X),这个定理亦可表示为:若Var[X]=0,则P(X=E[X])=1
-
贝努力大数定律:
设Xn是n重贝努力试验中事件A发生的次数.又设事件A发生的概率P(A)=p,则对任意的ϵ>0,有
n→0limP(∣nXn−p∣⩾ϵ)=0
这个就是弱大数定理.偏差几乎处处为0,但是不代表就不存在偏差.
-
矩,c为常数,k为正整数.则E(X−c)k称为X分布关于c的k阶矩.
-
c=0,则E[X]k称为X分布的k阶原点矩.记作μk;
-
c=E[X],则E[X−E[X]]k,称为X分布的k阶中心矩.记为υk
-
一阶原点矩就是期望,二阶中心距就是方差.
-
中心距和原点矩之间的关系
υk=i=1∑kCkiμi(−μ1)k−i
-
变异系数
Cυ=μ1υ2=E[X]Var[X]
变异系数,可以用来衡量从北京到上海的某些测量结果E[X]=1464(kilometer),σ(X)=500(meter),Cυ=0.00034,还有你测量100m的参数,E[Y]=100m,σ[Y]=0.05m,Cυ−0.0005,由此可见还是前者更为精确.
-
偏度
β1=(υ2)3/2υ3=[E[X−EX]2]3/2E[X−E[X]]3

正态分布的三阶中心距υ3=0→β1=0.
-
峰度 β2=υ22υ4
-
中位数 F(x0.5)=∫−∞x0.5p(x)dx=0.5
也就是图像在x0.5右边的概率和等于右边的概率和.
-
中位数一定存在,但是期望却不一定.
-
分布对称时,对称中心就是中位数.
-
分位数
F(xα)=∫−∞xαp(x)dx=α,0<α<1
下侧分位数
1−F(xα′)=∫xα′∞p(x)dx=α
-
众数,离散时,代表发生次数最多的事件.连续时,代表概率曲线的最大值
众数用Mod(X)表示.