【发布时间】:2012-09-19 17:16:17
【问题描述】:
我写信是想询问您对如何解释此案的意见。 我有两个要比较的向量“a”和“b”。
wilcoxon 测试给我的 pvalue 为 5.139217e-303 的 a 超过 b 与替代“更大”。现在,如果我对它们中的每一个做一个总结,我有以下内容
> summary(a)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.0000000 0.0001411 0.0002381 0.0002671 0.0003623 0.0012910
> summary(c)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.0000000 0.0000000 0.0000000 0.0004947 0.0002972 1.0000000
然后,平均比率约为 0.5399031,这天真地与 wilcoxon 测试相反(我期待找到一个比率 >> 1)
即使使用异常值包删除异常值后,我仍然有同样的事情。 有人可以帮我解释为什么我会得到这个结果以及如何解释它吗?
提前致谢
【问题讨论】:
-
这可能是一个统计问题而不是 R 问题。去除异常值应该没有什么区别,这是一个基于非参数等级的测试。 Wilcoxon 检验的原假设假设两个样本来自同一总体;正式陈述的替代假设是指中位数的差异(而不是均值),如果总体的方差差异很大,事情也可能很奇怪。如果没有看到数据本身(或者至少是关于分布的更多信息——直方图?),很难说。
-
另外,请注意
mean_b>mean_a、Q1_a>Q1_b(实际上是Q1_a>median_b); Wilcoxon 对后者很敏感(分位数的差异,而不是矩)
标签: r