背景

在学习集成学习时,周志华老师的西瓜书中出现了P()P(·)P()P(·|·)分别为概率质量函数,条件概率质量函数,在此进行扩充。

(注:研究一个随机变量,不只要看它能取什么值,更重要的是更重要的是各种取值的概率分布!!!!)

概率函数(分布律)-> 离散型

概率质量函数(Probability Mass Function,PMF)
用函数形式表达概率,如
Prob=P(X=ai)(i=1,2,3,4,5,6)Prob = P(X = a_i)(i = 1, 2, 3, 4, 5,6)
表示X分别为1, 2,3…,6的概率,但是一次只能表示一个随机变量的值

概率分布

概率分布就是将足有可能出现的情况以及情况相对应的概率值全部列出来

概率分布函数(累积分布函数)-> 离散型

累积分布函数 Accumulative Distribution Function(ADF)
设离散型随机变量XX的分布律是P(X=Xk)=pk(k=1,2,3....)P(X=X_k) = p_k(k=1, 2, 3....)F(x)=P(Xx)=xkxpkF(x)=P(X\leq x) = \sum_{x_k \leq x}p_k
由于F(x)F(x)XXx\leq x的所有xkx_k的概率之和,顾称F(x)F(x)为累积概率函数或概率分布函数。

概率密度函数和概率密度分布函数 -> 连续型

等价于离散型的概率函数
概率密度函数(Probability Density Function PDF)

定义

密度函数:取一个定点xx,则按照分布函数的定义,事件{x<X<x+h}\{x < X < x+h\}的概率(h>0)(h > 0为常数),因为F(x+h)F(x)F(x+h)-F(x),所以比值F(x+h)F(x)h\frac {F(x+h)-F(x)}{h}可以解释为在xx附近hh长的区间(x,x+h)(x, x+h)内,单位长度所占的概率,另h0h \to0,则这个比的极限,即F(x)=f(x)F'(x) = f(x),也就是说xx点处(无穷小区段内)单位长概率,或者说,它反映了概率在xx点处的“密集程度”。概率密度函数公式:
P(aXb)=F(b)F(a)=abf(x)dxP(a \leq X \leq b) = F(b)-F(a) = \displaystyle\int^b_af(x)dx
此处的概率就是求面积
面试之-3.0概率质量函数,概率密度函数,概率分布函数
左图是F(x)F(x)连续型随机变量分布函数,右图为f(x)f(x)连续型随机变量的概率密度函数,概率密度函数是分布函数的导函数。

概率密度和质量函数的区别

概率密度函数是对连续型随机变量定义的,本是不是概率,只有对其积分之后才是概率(某个特定值上的概率为0),但是概率质量函数是随机变量在各特定值上的概率。

参考链接

https://www.jianshu.com/p/b570b1ba92bb

相关文章: