随机变量:随机变量就是你去估计一件事可能发生的结果,然后把这些结果都用数字表达出来.(自己的理解,非准确定义)
如果随机变量的值都可以逐个列举出来,则为离散型随机变量。如果随机变量X的取值无法逐个列举则为连续型变量。
对于离散的,一般用频率函数去描述.
绝对频率:就是一个特定的变量在总量中出现的次数.所有变量出现的次数的总数等于总量的数量.
f1+f2+f3+…+fn=N∑fi=N
相对频率函数
就是归一化,原来的绝对频数除以总量,就能得到相对频数,所有变量的相对频数相加等于1.
hi=h(xi,Δx)=nki,i=1,2,3,…,m0≤h(xi,Δx)≤1∑i=1mh(xi,Δx)=∑i=1mnki=n1∑i=1mki=1
累积频数:就是逐级累加.
概率函数里,离散的叫概率质量函数,连续的叫概率密度函数.
概率质量函数.
离散型随机变量的概率函数(分布律),一个值对应一个概率.
也就是随机变量在各个可能值上对应的概率,用直方图表示,区间概率直接几个点相加?
概率密度函数
描述某个点的的概率的函数(暂且这么想吧,虽然点的概率是零)
区间概率看面积的差.
分布函数
(出现的原因是不想知道某个特定的值的概率,只想知道在某个范围内的概率)
概率函数累加的结果
概率分布函数怎么求?
离散就分布函数纵坐标算出来相减
连续就看纵坐标差值,纵坐标相减的结果表示在某一区间取值的概率
分布函数的特性:
非降性
对于任意实数:
x1<x2,F(x2)−F(x1)=P{x1<X<x2}≥0,F(x1)≤F(x2)
有界性
0≤F(x)≤1;F(−∞)=0,F(+∞)=1
右连续性
F(x)=F(x+0)
例子:
概率密度函数:
f(x)=6x−6x2x∈[0,1]
图像如下:

求分布函数F(X),也就是求积分.
下限为负无穷, 上限为x.
计算不定积分时,你无法判断它的常数项,所以需要加C;
计算定积分时,因为给出积分上下限,可以得出它的常数项,不需要加C.
这里相当于求定积分,所以不加C.
F(x)=∫−∞xf(t)dt
这里的F(x)是一个分段函数:
F(x)=⎩⎨⎧03x2−2x30(x<0)(0≤x≤1)(x>1)
期望值
对于离散型随机变量,期望值就是把随机变量的每个取值与其对应的概率相乘,然后再把其相加.公式如下:
E(X)=X1∗p(X1)+X2∗p(X2)+…+Xn∗p(Xn)=X1∗f(X1)+X2∗f(X2)+…+Xn∗f(Xn)E(X)=∑k=1∞xkpk
对于连续型随机变量,道理其实也是一样的,公式如下:
E(X)=μ=∫−∞∞xf(x)dx
另外要注意区分期望和均值,期望是理论上的,你去预测的,均值是实实在在用观测值算出来的.
参见:
https://www.zhihu.com/question/25391960
这道题其实就是算一个[0,1]内的定积分.
E(X)=∫01xf(x)dx=0.5
注意概率一般用小数表示哈.
方差
方差是一种特殊的期望,是随机变量的每个取值与其期望(均值)的差值的平方的期望.
σ2=E[(X−μ)2]=E(X2−2μX+μ2)=E(X2)−2μE(X)+μ2=E(X2)−2μ2+μ2=E(X2)−μ2
用这个式子计算是因为(X-μ)没法求.
算下来等于0.05
标准差也很简单,就是方差开方取正.没啥特别的,主要是为了统一单位.
要求一个在x定义域外的概率,比如求P(x>1.1),就是0
要求一个在x定义域内的概率,对于连续型函数来说,比如P(x=0.35),也是0.
只有在定义域内求区间概率才有意义,比如求P(0≤x≤0.5),前面说过,对于连续型,就是求对应分布函数的F(X)的差,或者用概率密度函数求面积也行.
P(0≤x≤0.5)=F(0.5)−F(0)=0.5