数学狂想曲（五）——概率分布（2）, 自相关&互相关&卷积

http://antkillerfarm.github.io/

概率分布（2）

上一篇《概率分布（1）》写的意犹未尽，这里继续写。本篇主要关注χ2分布、t分布和F分布，也就是统计学的三大祖师爷各自的看家本领。

χ2分布

设X1,…,Xn是来自总体N(0,1)的样本，则称统计量

χ 2 = X 21 + \dots + X 2 n (1)

服从自由度为n的χ2分布（chi-squared distribution），记作χ2∼χ2(n)。其PDF为：

f (x; n) = ⎧ ⎩ ⎨ ⎪ ⎪ ⎪ ⎪ x (n / 2 - 1) e - x / 2 2 n / 2 Γ (n 2), 0, x > 0; otherwise .

t分布

设X∼N(0,1),Y∼χ2(n)，并且X、Y独立，则称随机变量

t = X Y / n - - - - \sqrt (2)

服从自由度为n的t分布（t distribution），记作t∼t(n)。其PDF为：

f (t) = Γ (n + 1 2) n π - - - \sqrt Γ (n 2) (1 + t 2 n) - n + 1 2

F分布

设U∼χ2(d1),V∼χ2(d2)，并且U、V独立，则称随机变量

F = U / d 1 V / d 2 (3)

服从自由度为(d1,d2)的F分布（F distribution），记作F∼F(d1,d2)。其PDF为：

f (x; d 1, d 2) = (d 1 x) d 1 d d 2 2 (d 1 x + d 2) d 1 + d 2 - - - - - - - - - \sqrt x B (d 1 2, d 2 2) = 1 B (d 1 2, d 2 2) (d 1 d 2) d 1 2 x d 1 2 - 1 (1 + d 1 d 2 x) - d 1 + d 2 2

显然：

1 F \sim F (d 2, d 1)

假设检验

假设检验就是根据样本对所提出的假设H0作判断。

如果P{拒绝H0|H0为真}≤α，则接受H0。

这里的α被称作显著性水平。假设检验H0所涉及的统计量被称作检验统计量。

下表是正态总体均值、方差的检验法表格：

H0	检验统计量	H0为真时的统计量分布
μ=μ0(σ2已知)	z=x¯−μ0σ/n√	N(0,1)
μ=μ0(σ2未知)	t=x¯−μ0s/n√	t(n−1)
μ1−μ2=δ(σ21,σ22已知)	Z=x¯−y¯−δσ21n1+σ22n2√	N(0,1)
μ1−μ2=δ(σ21=σ22=σ2未知)	t=x¯−y¯−δsw1n1+1n2√,s2w=(n1−1)s21+(n2−1)s22n1+n2−2	t(n1+n2−2)
σ2=σ20(μ未知)	χ2=(n−1)s2σ20	χ2(n−1)
σ21=σ22(μ1,μ2未知)	F=s21s22	F(n1−1,n2−1)
μd=0(成对数据)	t=d¯−0s/n√	t(n−1)

上面这些和χ2分布、t分布、F分布有关的假设检验，又被称作χ2检验、t检验和F检验。对均值的假设检验，被称为μ检验。

上面这些都是正态样本的参数检验。

对于非参数检验或者非正态样本检验，其他的检验方法还有Wilcoxon signed-rank test、Kruskal–Wallis test、Friedman test等。

注：Frank Wilcoxon，1892～1965，美国化学家。康奈尔大学博士。先后供职于几家美国化工企业的研究机构。

William Henry (“Bill”) Kruskal，1919～2005，美国数学家。哥伦比亚大学博士，芝加哥大学教授。

Milton Friedman，1912～2006，美国经济学家。哥伦比亚大学博士，芝加哥大学教授。1976年获诺贝尔经济学奖。芝加哥学派第二代的领军人物。

Wilson Allen Wallis，1912～1998，美国经济学家。先后就读于明尼苏达大学和芝加哥大学，但是没有博士学位。罗彻斯特大学校长。从艾森豪威尔到里根的历届共和党总统的顾问。Milton Friedman的至交。其父Wilson Dallam Wallis为美国人类学家，明尼苏达大学教授。

一元线性回归的显著性检验

假设y关于x的回归具有形式a+bx，则H0:b=0。

这里使用t检验法进行假设检验。

首先，不加证明的给出如下结论：

推论1：y¯∼N(a+bx¯,σ2/n)

推论2：b^∼N(b,σ2/Sxx)

推论3：y^0=a^+b^x0=y¯+b^(x0−x¯)∼N(a+bx0,[1n+(x0−x¯)2Sxx]σ2)

推论4：Qe/σ2∼χ2(n−2)

推论5：y¯,b^,Qe相互独立。

推论6：若y0=a+bx0+ϵ0与y1,…,yn独立，则y0,y^0,Qe相互独立。

其中，y¯表示y的均值，而y^表示y的估计值,Sxx表示方差，Qe为残差平方和∑ni=1(yi−y^i)2。

由推论4可得：

E (Q e / σ 2) = n - 2

即：

Q e = σ^2 (n - 2) (3)

由推论2和5、公式2和3，可得：

b^- b σ 2 / S x x - - - - - - \sqrt / (n - 2) σ^2 σ 2 / (n - 2) - - - - - - - - - - - - - - - - \sqrt \sim t (n - 2)

即：

b^- b σ^S x x - - - \sqrt \sim t (n - 2)

当假设H0被拒绝时，认为回归效果是显著的，反之就认为回归效果不显著。

不显著的原因可能有以下几种：

1.影响y取值的，除了x，还有其他不可忽略因素。

2.y与x的关系不是线性的，存在其他的关系。

3.y与x不存在关系。

KS检验

Kolmogorov–Smirnov test用于对样本是否属于某种分布进行假设检验。

注：Andrey Nikolaevich Kolmogorov，1903～1987，二十世纪俄国最伟大的数学家之一。莫斯科州立大学博士和教授。俄罗斯科学院院士，挪威科学院和英国皇家学会外籍院士。沃尔夫奖获得者（1980年）。他在数学的许多领域都有重要贡献，以他的名字命名的理论竟有30项之多。

由于Nobel Prizes没有数学奖，因此数学界的最高奖一般有三个：
1.Fields Medal。获奖难度最高，因为有40岁的年龄限制。在国内比较知名的丘成桐、陶哲轩都是该奖的获奖者。
不过他们还不是最屌的。Grigori Perelman（Poincaré conjecture的证明者）直接拒绝了Fields Medal。除此之外，他还拒绝了EMS Prize和Millennium Prize，其中后者奖金高达100万美元，而且还不知道下一个获奖者什么时候诞生（该奖不是年度奖，而是数学难题奖，数学难题的解决周期，你懂的）。
Perelman犹如一个特立独行的隐士，谁的账都不买，包括名利。他将他的伟大证明随手扔进arXiv这样一个非正规网站，但却被《Science》评为年度科学突破。数学界已经很多年没有这样的荣誉了。
补充一下，Perelman就读的中学是Kolmogorov创建的。
2.Abel Prize。和Nobel Prizes的规则相同，由于不限年龄，水平是最高的。缺点是这个奖是2001年才创建的，影响力略差。
3.Wolf Prize。在Abel Prize创建之前，被誉为数学界的Nobel Prizes。

Nikolai Vasilyevich Smirnov，1900～1966，俄国数学家。莫斯科大学博士，斯塔克罗夫数学研究所研究员。

Vladimir Andreevich Steklov，1864～1926，俄国数学家、物理学家。哈尔科夫大学博士，其导师是圣彼得堡学派第二代人物中，仅次于Andrey Markov的Aleksandr Lyapunov。哈尔科夫大学和圣彼得堡大学教授，1919年创建斯塔克罗夫数学研究所。

斯塔克罗夫数学研究所是一家专职研究没有教学任务和科研任务的研究机构。Grigori Perelman在这里，曾有6年时间没有发表一篇论文。二十世纪俄罗斯绝大多数的数学发现都源自这里。

数学狂想曲（五）——概率分布（2）, 自相关&互相关&卷积

上图的红线是某随机变量假设分布的CDF，而蓝线是该随机变量样本的累积分布曲线，即ECDF（Empirical Distribution Function）。

显然若假设正确的话，两条曲线应该是基本重合的。反之，若两条曲线差异较大，则该假设检验不成立。这就是KS检验的基本原理。

KS检验的统计量定义如下：

D n = sup x | F n (x) - F (x) |

其中sup表示最小上界，

F n (x) = 1 n \sum i = 1 n I [- \infty, x] (X i)

I [- \infty, x] (X i) = {1, 0, X i \leq x otherwise

KS检验更深入的解释，涉及到布朗运动和维纳过程，这里不再赘述。

自相关&互相关&卷积

数学狂想曲（五）——概率分布（2）, 自相关&互相关&卷积

1.自相关（Autocorrelation）。这个最简单，就是平移之后，自己和自己比。显然当平移为0的时候，自相关值最大，因此这类操作通常用于信号的检测。信号接收端模拟发射端的信号序列，对实际接收到的信号进行相关操作，只有当两者的序列接近重合时，才会检测到信号峰值。

2.互相关（Cross-correlation）。检测两个序列的相似度，显然两者越相似，互相关值越大。这在统计学方面用的比较多。

3.卷积（Convolution）。卷积主要用于线性时不变系统的信号处理。相比于互相关操作，卷积有个旋转180度的操作，这里解释一下它的物理意义。

例如，当一个拳击选手遭到对方连续两次击打身体的同一部位时，第二次被击打时他感觉到的疼痛是第一次被击打所遗留的疼痛与第二次被击打的疼痛之和。即：

f (2) = f 1 (2) + f 2 (1)

其中，fi(t)中，i表示第i次击打，t表示击打发生之后经过的时间。可以看出i和t的顺序正好是相反的，这也就是Convolution这个名词的本意。这里假设g为常数。

4.这三个操作在离散域最终都可以变为求和操作，也就是向量内积运算。我们一般使用a⋅b或者⟨a,b⟩表示向量的内积运算。即：

⟨ a, b ⟩ = a 0 b 0 + a 1 b 1 + \dots + a n b n