12 均值的假设检验

标签：机器学习与数据挖掘
（此篇的R代码对应本系列的《12 R语言手册（第五站单变量分析）》）

1.假设检验基本概念

假设检验是指使用样本中的证据来断言总体参数值的过程。针对参数值，精心设计了两种矛盾的声明或假设。具体如下：

零假设 $H_0$ 是原假设，表示参数值已经假定的内容。
另一种假设或研究假设 $H_a$ 表示参数值的另一个断言。
两种可能的结论是 $(a)$ 拒绝 $H_0$ 和 $(b)$ 不拒绝 $H_0$ 。刑事审判是一种假设检验形式，具有如下的假设：
$H_0$ ：被告是无辜的
$H_a$ ：被告是有罪的

在这两个假设之下，又有四种情况：

类型I错误：当 $H_0$ 是真时，拒绝 $H_0$ 。陪审团宣判一个无辜的人有罪。
类型IⅡ错误：当 $H_0$ 假时，没有拒绝 $H_0$ 。陪审团无罪释放一个有罪的人。
正确的裁决：当 $H_0$ 是假时，拒绝 $H_0$ 。陪审团宣判一个有罪的人有罪。
正确的裁决：当 $H_0$ 是真时，没有拒绝 $H_0$ 。陪审团无罪释放一个无辜的人。

类型I错误的概率记为 $\alpha$ ，而类型IⅡ错误的概率记为 $\beta$ 。对于一个固定样本容量， $\alpha$ 减小与 $\beta$ 增大相关，反之亦然。在统计分析中， $\alpha$ 通常固定在某个较小值，例如0.05，称之为显著性水平。
均值假设检验的一般处理是将假设限定为以下3种形式：
（其中 $\mu_0$ 表示 $\mu$ 的一个假设值。）

左尾检验。 $H_0:\mu \geqslant \mu _0$ 与 $H_0:\mu <\mu _0$
右尾检验。 $H_0:\mu \leqslant \mu _0$ 与 $H_0:\mu >\mu _0$
双尾检验。 $H_0:\mu = \mu _0$ 与 $H_0:\mu \ne \mu _0$

当样本容量很大或者总体为正态分布时，检验统计量 $t{data}=\frac{\bar{x}-\mu 0}{\frac{s}{\sqrt{n}}}$ 遵循自由度为 $n-1$ 的t分布。 $t_{data}$ 的值可理解为在假设的均值 \mu 之上或之下的标准误差数目，样本均值 $\bar{x}$ ，其中标准误差等于 $\frac{s}{\sqrt{n}}$ （粗略地讲，标准误差表示统计量分布的分散程度度量）。当 $t_{data}$ 值为极值时，这表明一种零假设（伴随假设值$ \mu_0 $）和观测数据之间的冲突。由于数据表示经验证据零假设仅仅表示一种断言，因此解决这样的冲突有利于数据，因此，当$ t_{data} $为极值时，假设$ H_0 $是拒绝的。什么样的极值才算是极值？需要使用 p-值进行度量。 p-值是指：如果我们假定零假设为真时，观测样本统计量（比如$ \bar{x} $和$ t_{data}$。）至少与真实测的统计量一样极端的概率。由于 p-值（“概率值”）表示一个概率，因此其值必须总是于 0 和 1 区间。下表说明了针对假设检验形式如何计算p-值。

12 均值的假设检验

假设检验形式的名称表明p-值将会在t分布的哪尾或双尾中发现。
一个较小p-值将表明数据与零假设之间的冲突。因此，如果p-值较小，我们将拒绝H_0。
多小才为较小？因为研究者设置显著性水平 $\alpha$ 为某个较小值（比如0.05），因此，如果 p-值小于 $\alpha$ ，我们则认为p-值较小。这引导我们得出拒绝规则：
“如果p-值小于 $\alpha$ ，拒绝 $H_0$ 。”

2.比例的假设检验

关于总体比例\pi的假设检验也可以被执行。检验统计量为：
$Z_{data}=\frac{p-\pi _0}{\sqrt{\left( \pi _0\left( 1-\pi _0 \right) /n \right)}}$
（其中， $\pi_0%为%\pi$ 的假设值， $p$ 为样本比例。）

12 均值的假设检验

3.拓展

关于检验假设的历史，知乎上有个特别好的答案：https://www.zhihu.com/question/317252051/answer/633033538?utm_oi=50144498155520