相关性分析及显著性检验
1 相关性分析
1.1 计算Pearson相关系数的变量要求
①两变量相互独立
②两变量为连续变量
③两变量的分布遵循正态分布
④两变量呈线性关系
1.2 正态分布检验方法(SPSS)
分析→描述统计→频率
统计量
图表
k (峰度)s(偏度) 接近于0,就会接近正态分布,从图表也可以看出。
1.3 person相关系数计算
有了公式,就可以用R、Python代码实现。
2 相关性的显著性检验
由于抽样具有偶然性,需要检验总体是否也具有相关性。
按照中心极限定律,总体中抽样的样本的频率画在xy坐标系上,符合t分布。
t分布与t检验原理
因此我们把自己认为不可能发生的事件作为假设H0,它的对立事件作为假设H1!
我们要做的就是推翻H0,只要它发生的概率p小于显著性水平0.05,说明它不可能发生。
反之,H1成立。
检验方法:检验统计量的概率小于显著性水平的事件不可能发生,拒绝假设H0,H1成立。
单尾检验:假设H0相关系数<=0,H1选择右尾检验;反之,H1左尾检验。
双尾检验:假设H0相关系数=0,H1选择双尾。
检验的统计量:
统计T发生的概率,小于0.05,拒绝假设H0。