使用 R 检验比例的统计差异答案

【问题标题】：Test for statistical difference in proportions using R使用 R 检验比例的统计差异
【发布时间】：2015-03-05 03:22:22
【问题描述】：

我正在尝试解决以下问题：

一个人可以分为 GroupA、GroupB 或 GroupC。

我想知道属性 1（或属性 2）如何影响这些组中的观察比例。请注意，attribute1:attribute2 具有 1:N 的关系。 Attribute1 有五个可能的值，A,B,C,D,E，而 attribute2 有两个可能的值：A,B。

模拟数据：

obsGroupA <- round(runif(40, 240, 63535))
obsGroupB <- round(runif(40, 2478, 95063))
obsGroupC <- round(runif(40, 3102, 104799))
propGroupA <- obsGroupA/(obsGroupA + obsGroupB + obsGroupC)
propGroupB <- obsGroupB/(obsGroupA + obsGroupB + obsGroupC)
propGroupC <- obsGroupC/(obsGroupA + obsGroupB + obsGroupC)
#propGroupA + propGroupB + propGroupC
attributeA <- c("A", "B", "C", "D", "E")[runif(40, 1, 5)]
attributeB <- ifelse(attributeA %in% c("A", "B", "E"), "A", "B")

模型尝试：

#y <- cbind(obsGroupA, obsGroupB, obsGroupC)
y <- cbind(propGroupA, propGroupB, propGroupC)
model <- glm(y ~ attributeA)

我收到以下错误：

x[good, , drop = FALSE] 中的错误：（下标）也是逻辑下标长

知道如何在 R 中进行统计测试吗？
任何对正确统计测试的参考也将不胜感激。

谢谢。

【问题讨论】：

您似乎有两个问题：i）从统计的角度来看，您不知道自己在做什么，并且 ii）您不知道如何让 R 做您想做的事情.你会在Cross Validated 上获得关于 i) 的帮助，但不一定是 ii) 并且你需要将问题更多地集中在我应该在这个问题的一边使用什么统计方法上，以便在 Cross Validated 上成为主题。
我投票决定将此问题作为离题结束，因为它与编程无关。 OP 需要统计帮助，这将决定需要在软件中完成的工作。

标签： r statistics glm

【解决方案1】：

嗯，你应该先看看已经评论过的回归分析。你在理解那里有一些问题。但是，这就是你想要的：

obsGroupA <- round(runif(40, 240, 63535))
obsGroupB <- round(runif(40, 2478, 95063))
obsGroupC <- round(runif(40, 3102, 104799))
propGroupA <- obsGroupA/(obsGroupA + obsGroupB + obsGroupC)
propGroupB <- obsGroupB/(obsGroupA + obsGroupB + obsGroupC)
propGroupC <- obsGroupC/(obsGroupA + obsGroupB + obsGroupC)
#propGroupA + propGroupB + propGroupC
attributeA <- c("A", "B", "C", "D", "E")[runif(40, 1, 5)]
attributeB <- ifelse(attributeA %in% c("A", "B", "E"), "A", "B")

y <- data.frame(propGroupA, propGroupB, propGroupC,attributeA,attributeB)
model <- glm(propGroupA ~ attributeA ,data=y )
summary(model)

【讨论】：

谢谢 - 现在可以了。我不确定是否有类似卡方应变测试的东西。我想正如@Gavin Simpson 所说，这更像是一个统计问题。我认为我上面得到的错误是因为我在 y
虽然它不是二项式……但二项式是一个 0/1 变量。在这种情况下，您有一个连续变量作为“y”，因此您不想更改为“family = binomial”。而且你不需要卡方。而且您无需将 y 更改为您建议的内容。相信我。我拥有经济学博士学位，并且在回归分析上花费了太多时间。如果要求A的比例对A&B的影响，它的PropA = AttA + AttB。如果你想要道具 B，那就是 PropB = AttA + AttB