一维随机变量

随机变量

我们将样本空间抽象化，随机事件数量化，随机变量表示随机试验各种结果的实值单值函数。我们可以用频率函数和累积分布函数来研究随机变量

频率函数

频率函数 / 概率质量函数包括两个方面

随机变量的所有可能
随机变量取每个值的可能性

频率函数的性质：

每个可能性都大于0
所有可能性之和为1

频率函数一定满足这两个性质，满足这两个性质的也一定是频率函数

累积分布函数

通过累积分布函数F(x)，使得离散的点变得连续，可以用微积分工具来分析

累积分布函数在每个区间左闭右开

累积分布函数的性质

单调不减
左端趋于0，右端趋于1
右连续性

累积分布函数一定满足这三个性质，满足这两个性质的也一定是累积分布函数

离散型随机变量

定义：若随机变量X仅取有限或可列个值，则称X为离散型随机变量

以下列出常见的离散型随机变量

单点分布

也被称为退化分布

随机变量X只能取一个值c，\(P(X = c) = 1\)

(0-1)两点分布

\(P(X = 0) = p, P(X = 1) = 1-p\)

任意只产生两种结果，或者只能分为两种情况的试验，都可以用(0-1)两点分布来描述

二项分布

伯努利试验：只有两种结果的试验，可以用(0-1)两点分布来描述

\(P (X = 0) = p, P (X = 1) = q, p + q = 1\)

伯努利试验具有性质

重复：每次试验中概率\(P(X = 0) = p\)不会变
独立：试验与试验间不会相互影响

n重伯努利试验就是将伯努利试验进行n次，统计试验结果为1的次数，记为X

X的频率函数为

则记\(X \sim b (n, p)\)，称 X 服从二项分布

二项分布的期望为\(np\)，方差为\(np(1-p)\)

几何分布

几何分布也是由多次伯努利试验构成，代表的含义是前k-1次试验都失败，但第k次试验成功

频率函数为

负二项分布

负二项分布是几何分布的一般化，也是由多次伯努利试验构成，代表的是第k次试验刚好第r次成功

频率函数为

超几何分布

超几何分布描述了从有限n个物件（其中包含r个指定种类的物件）中抽出m个物件，m个物件中有k个指定物件的概率

频率函数为

泊松分布

泊松流的定义：随着时间的推移,在时间轴上源源不断出现的随机粒⼦流称为泊松流

在泊松流中，记区间 [ 0 , t ] 中出现的质点数为 X，X服从的是泊松分布

泊松分布适合于描述单位时间内随机事件发生的次数的概率分布

频率函数为

\(λ\)被称为泊松强度，代表的是是单位时间（或单位面积）内随机事件的平均发生率

泊松分布的期望和方差都是\(λ\)

泊松定理

当n很大，p很小，二项分布近似于泊松分布

连续型随机变量

概率密度函数

如果随机变量X的累积分布函数可以表达为下述形式

\(f(t)\)满足大于0

则称X为连续性随机变量，\(f(t)\)为概率密度函数

\(f(t)\)满足以下几个性质

\(f(t) >= 0\)
\(\int_{-∞}^{+∞}f(t)dt = 1\)
\(P(x1 < X <= x2) = F(x2) - F(x1) = \int_{x1}^{x2}f(t)dt\)
\(f(x) = F\'(x)\)，当 f(X) 在 X = x 处连续

p分位数

\(P(X <= x_p) = \int_{-∞}^{x_p} f(t)dt = p\)

均匀分布

当X在 (a,b) 上等可能取值，记\(X \sim U (a, b)\)

密度函数

指数分布

如果随机变量X的密度函数为

则称X服从参数为λ的指数分布，记为\(X \sim EXP(λ)\)

λ被称为失效率，\(λ^{-1}\)被称为平均寿命

指数分布经常被用于描述“寿命”的分布

指数分布的一个重要性质是无记忆性，描述如下

\(P\{X > s+t | X > s\} = P \{X > t\}\)

指数分布的期望是\(λ^{-1}\)，方差是\(λ^{-2}\)

指数分布和泊松分布的关系

\(X \sim P(λt)\)

用Y来表示遇到第一个泊松流质点的时间

\(P(Y <= t) = 1 - P(Y > t) = 1 - P(X = 0) = 1 - e^{-λt}\)

Y的累积分布函数就是指数分布的累积分布函数

伽马分布

伽马分布是指数分布的拓展

\(X \sim P(λt)\)

用Y来表示遇到第一个泊松流质点的时间，则\(Y \sim EXP(λ)\)

用Z来表示遇到第r个泊松流质点的时间，则Z服从伽马分布

频率函数为

\(Γ(r) = (r-1)!\)，当r为自然数

正态分布

当f(x)满足

称X服从正态分布，记为\(X \sim N(μ， σ^2)\)

\(f(x)\)形状如下

\(f(x)\)服从以下几个性质

\(f(x)\)关于x = μ对称
当 x > μ 时，\(f(x)\)递减，且\(\lim_{x\to+∞} f(x) = 0\)；

当 x < μ时，\(f(x)\)递增，\(\lim_{x\to-∞} f(x) = 0\)；

\(f(x)\)在\(x = μ\)处取得最大值，\(f_{max}(x) = \frac{1}{\sqrt{2Π}σ}\)

标准正态分布

当\(μ = 0， σ^2 = 1\)时，此时正态分布被称为标准正态分布

概率密度函数为

累积分布函数为

通过转换可以使任意正态分布变成标准正态分布

连续型随机变量的函数

示例

当\(g(x)\)不严格单调时，可以进行分段