【发布时间】:2015-03-05 03:22:22
【问题描述】:
我正在尝试解决以下问题:
一个人可以分为 GroupA、GroupB 或 GroupC。
我想知道属性 1(或属性 2)如何影响这些组中的观察比例。请注意,attribute1:attribute2 具有 1:N 的关系。 Attribute1 有五个可能的值,A,B,C,D,E,而 attribute2 有两个可能的值:A,B。
模拟数据:
obsGroupA <- round(runif(40, 240, 63535))
obsGroupB <- round(runif(40, 2478, 95063))
obsGroupC <- round(runif(40, 3102, 104799))
propGroupA <- obsGroupA/(obsGroupA + obsGroupB + obsGroupC)
propGroupB <- obsGroupB/(obsGroupA + obsGroupB + obsGroupC)
propGroupC <- obsGroupC/(obsGroupA + obsGroupB + obsGroupC)
#propGroupA + propGroupB + propGroupC
attributeA <- c("A", "B", "C", "D", "E")[runif(40, 1, 5)]
attributeB <- ifelse(attributeA %in% c("A", "B", "E"), "A", "B")
模型尝试:
#y <- cbind(obsGroupA, obsGroupB, obsGroupC)
y <- cbind(propGroupA, propGroupB, propGroupC)
model <- glm(y ~ attributeA)
我收到以下错误:
x[good, , drop = FALSE] 中的错误:(下标)也是逻辑下标 长
知道如何在 R 中进行统计测试吗?
任何对正确统计测试的参考也将不胜感激。
谢谢。
【问题讨论】:
-
您似乎有两个问题:i)从统计的角度来看,您不知道自己在做什么,并且 ii)您不知道如何让 R 做您想做的事情.你会在Cross Validated 上获得关于 i) 的帮助,但不一定是 ii) 并且你需要将问题更多地集中在我应该在这个问题的一边使用什么统计方法上,以便在 Cross Validated 上成为主题。
-
我投票决定将此问题作为离题结束,因为它与编程无关。 OP 需要统计帮助,这将决定需要在软件中完成的工作。
标签: r statistics glm