【问题标题】:Comparing Group Means with Chi-Squared比较组均值与卡方
【发布时间】:2012-04-16 13:17:47
【问题描述】:

我想看看我的数据中的组均值差异是否具有统计学意义。

如何对像这样的长格式数据进行卡方检验

Country        Year     Value
Country A       1         2
Country A       2         3
Country A       3         3
Country B       1         6
Country B       2         7
Country B       3         6
Country C       1         9
Country C       2         8
Country C       3         9

我不知道如何对同一个变量进行卡方检验,但要针对不同的组(国家)。

谢谢

【问题讨论】:

  • “值”列的值是多少?

标签: r chi-squared


【解决方案1】:

对于像这样的大多数统计测试,您需要将数据从长格式重新格式化为适当的宽格式。我喜欢 reshape2 包来帮助解决这些问题。

例如:

> x <- read.table(text = "Country        Year     Value
+ Country.A       1         2
+ Country.A       2         3
+ Country.A       3         3
+ Country.B       1         6
+ Country.B       2         7
+ Country.B       3         6
+ Country.C       1         9
+ Country.C       2         8
+ Country.C       3         9", header = TRUE)
> 
> 
> library(reshape2)
> wide <- dcast(x, Country ~ Year, value.var = "Value")
> wide
    Country 1 2 3
1 Country.A 2 3 3
2 Country.B 6 7 6
3 Country.C 9 8 9

现在它更接近chisq.test() 或您可能有兴趣运行的任何其他测试所需的格式。第一行包含最有可能需要从分析中排除的 Country 列,因为它与计数无关:

> wide[, -1]
  1 2 3
1 2 3 3
2 6 7 6
3 9 8 9

我将由您决定哪种测试适合您的数据。

【讨论】:

  • 我认为应该进一步思考独立性假设和测量类型。 R chisq.test 专为计数而设计。我们知道这些是计数吗?你在测试什么假设?
  • @Dwin - 很公平,我可能应该在将数据从长到宽重新组织后停止......
  • 我正在寻找方法来比较同一变量上的组均值,并证明不同的均值具有统计学意义。我的数据有 67 个国家/地区,每个国家/地区都有多个观察值 (10-15)。我想找到一种方法来证明不同国家/地区的平均值具有统计意义。
  • 到目前为止,我已经运行了三种不同的 OLS 回归来尝试展示这一点。首先,我对 66 个国家的虚拟变量进行了价值回归。这可以表明,许多国家虚拟变量的系数在统计上是显着的,并且与基准国家不同。其次,我创建了一个虚拟变量,对所有 GDP 中值以上的国家取值为 1。这可以表明“贫穷”国家和“富裕”国家之间的平均值差异在统计上是不同的。
  • 我还想进行卡方检验,它应该告诉我是否有任何组均值与合并均值显着不同(一个非常低的条形图)。但是,我不知道如何对以下长格式的数据进行卡方检验。
【解决方案2】:

您尚未指定要检验的假设,因此尚无法应用“卡方检验”。 (您指定了一个您不确定实施的特定案例这一事实表明他可能是家庭作业。)从您提供的数据中可以清楚地看出,这些行根本不是独立的。您只有三个国家,然后在连续时间间隔内重复测量具有整数值的事物。这些算不算?如果这是为了讨论目的而简化更丰富的数据集,那么您需要修改您的问题并努力构建一个现实的测试用例,以便可以提供实质性的 cmets

【讨论】:

  • 我想这是一个合理的答案。对于不完整的问题,有时您只能提供不完整的答案。
  • 没什么大不了的,但我会说在这种情况下 no 答案(即只有 cmets)是有保证的,直到问题完成......
猜你喜欢
  • 2019-07-03
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2015-05-01
  • 2018-06-09
  • 1970-01-01
  • 2015-03-12
  • 2013-04-27
相关资源
最近更新 更多