【发布时间】:2020-08-06 08:16:05
【问题描述】:
我想执行一个双样本单尾 t 检验来比较两个均值。对于我正在寻找的具体问题,我希望仅在一个方向进行比较。我希望原假设是mu_2 > mu_1,而备择假设是mu_1 <= mu_2。或者,即使对于单尾情况,原假设仍然是 mu_1 - mu_2 = 0?
我正在处理一个大型数据集,但如果我要提取和四舍五入参数,对于 data_1,它是 mu_1 = 4.3, s_1 = 4.8, and n_1 = 40000,而对于 data_2,它是 mu_2 = 4.9, s_2 = 4.4, n_2 = 30000。我正在使用 scipy 执行两个样本的 t 检验:
stats.ttest_ind(data1,
data2,
equal_var = False)
鉴于 scipy 仅考虑双尾测试,我不确定如何解释这些值。 Ttest_indResult(statistic=-19.51646312898464, pvalue=1.3452106729078845e-84)。 alpha 值为 0.05,p 值远小于表示拒绝原假设的值。但是,我的直觉告诉我不应该拒绝原假设,因为 mu_2 明显大于 mu_1(至少我希望 p 值更大)。因此,我觉得我要么错误地解释了结果,要么需要额外的计算才能得到正确的答案。
如果有任何额外的帮助和指导,我将不胜感激。谢谢!
【问题讨论】:
-
从我读到的文档中,我读到 stats_ttest_ind 测试了两个均值相同的 NULL 假设,因此返回一个如此小的 p 值这一事实表明这两个均值差异太大而无法被偶然解释。在这种情况下,NULL 假设应该是 mu_1=mu_2,以保持测试简单。
标签: python scipy statistics inference t-test