随机变量
我们将样本空间抽象化,随机事件数量化,随机变量表示随机试验各种结果的实值单值函数。我们可以用频率函数和累积分布函数来研究随机变量
频率函数
频率函数 / 概率质量函数包括两个方面
- 随机变量的所有可能
- 随机变量取每个值的可能性
频率函数的性质:
- 每个可能性都大于0
- 所有可能性之和为1
频率函数一定满足这两个性质,满足这两个性质的也一定是频率函数
累积分布函数
通过累积分布函数F(x),使得离散的点变得连续,可以用微积分工具来分析
累积分布函数在每个区间左闭右开
累积分布函数的性质
- 单调不减
- 左端趋于0,右端趋于1
- 右连续性
累积分布函数一定满足这三个性质,满足这两个性质的也一定是累积分布函数
离散型随机变量
定义: 若随机变量X仅取有限或可列个值,则称X为离散型随机变量
以下列出常见的离散型随机变量
单点分布
也被称为退化分布
随机变量X只能取一个值c,\(P(X = c) = 1\)
(0-1)两点分布
\(P(X = 0) = p, P(X = 1) = 1-p\)
任意只产生两种结果,或者只能分为两种情况的试验,都可以用(0-1)两点分布来描述
二项分布
伯努利试验:只有两种结果的试验,可以用(0-1)两点分布来描述
\(P (X = 0) = p, P (X = 1) = q, p + q = 1\)
伯努利试验具有性质
- 重复:每次试验中概率\(P(X = 0) = p\)不会变
- 独立:试验与试验间不会相互影响
n重伯努利试验就是将伯努利试验进行n次,统计试验结果为1的次数,记为X
X的频率函数为
则记\(X \sim b (n, p)\),称 X 服从二项分布
二项分布的期望为\(np\),方差为\(np(1-p)\)
几何分布
几何分布也是由多次伯努利试验构成,代表的含义是前k-1次试验都失败,但第k次试验成功
频率函数为
负二项分布
负二项分布是几何分布的一般化,也是由多次伯努利试验构成,代表的是第k次试验刚好第r次成功
频率函数为
超几何分布
超几何分布描述了从有限n个物件(其中包含r个指定种类的物件)中抽出m个物件,m个物件中有k个指定物件的概率
频率函数为
泊松分布
泊松流的定义:随着时间的推移,在时间轴上源源不断出现的随机粒⼦流称为泊松流
在泊松流中,记区间 [ 0 , t ] 中出现的质点数为 X,X服从的是泊松分布
泊松分布适合于描述单位时间内随机事件发生的次数的概率分布
频率函数为
\(λ\)被称为泊松强度,代表的是是单位时间(或单位面积)内随机事件的平均发生率
泊松分布的期望和方差都是\(λ\)
泊松定理
当n很大,p很小,二项分布近似于泊松分布
连续型随机变量
概率密度函数
如果随机变量X的累积分布函数可以表达为下述形式
\(f(t)\)满足大于0
则称X为连续性随机变量,\(f(t)\)为概率密度函数
\(f(t)\)满足以下几个性质
- \(f(t) >= 0\)
- \(\int_{-∞}^{+∞}f(t)dt = 1\)
- \(P(x1 < X <= x2) = F(x2) - F(x1) = \int_{x1}^{x2}f(t)dt\)
- \(f(x) = F\'(x)\),当 f(X) 在 X = x 处连续
p分位数
\(P(X <= x_p) = \int_{-∞}^{x_p} f(t)dt = p\)
均匀分布
当X在 (a,b) 上等可能取值,记\(X \sim U (a, b)\)
密度函数
指数分布
如果随机变量X的密度函数为
则称X服从参数为λ的指数分布,记为\(X \sim EXP(λ)\)
λ被称为失效率,\(λ^{-1}\)被称为平均寿命
指数分布经常被用于描述“寿命”的分布
指数分布的一个重要性质是无记忆性,描述如下
\(P\{X > s+t | X > s\} = P \{X > t\}\)
指数分布的期望是\(λ^{-1}\),方差是\(λ^{-2}\)
指数分布和泊松分布的关系
\(X \sim P(λt)\)
用Y来表示遇到第一个泊松流质点的时间
\(P(Y <= t) = 1 - P(Y > t) = 1 - P(X = 0) = 1 - e^{-λt}\)
Y的累积分布函数就是指数分布的累积分布函数
伽马分布
伽马分布是指数分布的拓展
\(X \sim P(λt)\)
用Y来表示遇到第一个泊松流质点的时间,则\(Y \sim EXP(λ)\)
用Z来表示遇到第r个泊松流质点的时间,则Z服从伽马分布
频率函数为
\(Γ(r) = (r-1)!\), 当r为自然数
正态分布
当f(x)满足
称X服从正态分布,记为\(X \sim N(μ, σ^2)\)
\(f(x)\)形状如下
\(f(x)\)服从以下几个性质
- \(f(x)\)关于x = μ对称
- 当 x > μ 时,\(f(x)\)递减,且\(\lim_{x\to+∞} f(x) = 0\);
当 x < μ时,\(f(x)\)递增,\(\lim_{x\to-∞} f(x) = 0\);
- \(f(x)\)在\(x = μ\)处取得最大值,\(f_{max}(x) = \frac{1}{\sqrt{2Π}σ}\)
标准正态分布
当\(μ = 0, σ^2 = 1\)时, 此时正态分布被称为标准正态分布
概率密度函数为
累积分布函数为
通过转换可以使任意正态分布变成标准正态分布
连续型随机变量的函数
示例
当\(g(x)\)不严格单调时,可以进行分段