【发布时间】:2017-01-25 18:49:00
【问题描述】:
我在处理分层数据结构以获得简单的描述性统计数据时遇到问题;对于每个 1 级观察,我有几个(但数量不同)2 级观察,例如:
Level 1 Level2 x y z k
1 a 0.12 1 debt 0
1 b 0.08 1 debt 0
1 c 0.22 1 debt 0
2 d 0.32 0 credit 1
2 e 0.17 0 credit 1
3 f 0.20 1 credit 1
3 g 0.11 1 credit 1
3 h 0.05 1 credit 1
3 i 0.01 1 credit 1
虽然一些变量取决于级别 2 (x),但其他变量 (y,z,k) 取决于级别 1。如果我如何获得描述性统计数据 - 例如 table(k) - 分组为级别 1 而不是级别 2?
例如。 table(k) 在这种特殊情况下产生 6,但我希望它产生 2,例如当 k=1 时级别 1 的集群数,类似于 table(k ~ study)
提前感谢您的帮助
马可
【问题讨论】:
-
dplyr 包有一个 group_by() 函数可以在这里使用:
k %>% group_by(Level 1) %>% summarise(COUNTS = n(), SUM = sum(x)) -
感谢您的帮助。它产生
Error in UseMethod("group_by_") : no applicable method for 'group_by_' applied to an object of class "c('integer', 'numeric')" -
您是否安装并加载了库
dplyr?此外,函数是'group_by()。group_by_()可能不是你想要的。 -
是的,它已加载,但似乎这两个函数都无法处理虚拟 k 等数值
-
告诉我而不显示我没有帮助 - 发布您的代码,以便我可以更好地帮助您。您的输出可能有问题:stackoverflow.com/questions/30895876/error-with-dplyr-group-by
标签: r statistics hierarchical-data