【发布时间】:2015-06-10 10:12:49
【问题描述】:
我正在使用 dplyr 为一系列文件计算变量 [mode] 的分组。目标是构建一个数据框,您可以在其中复制(cbind)每个文件的结果(欢迎任何关于更好数据结构的想法)。
所以文件是这样的:
FILE 1:
id |mode | no.cases
1 1 3
2 2 1
3 5 2
FILE 'n':
id |mode | no.cases
1 1 11
2 3 7
3 4 1
某些文件可能包含所有 5 个类别的条目,而其他文件仅包含其中 2 或 3 个类别的条目。我可以使用以下方法从完整文件中获取所有现有类别:
categories<-factor(mode)
不过,使用 group_by 时还是会出现问题:
result <-group_by(file,mode,sum(no.cases))
result (for file 1):
mode | no.cases
1 3
2 1
5 2
因为你不能在不同的号码上绑定。行数:在某些情况下,生成的数据框将有 5 行,在某些情况下只有 3 行。
如何使用 group_by 以便它为每个文件显示所有现有类别,以及不显示值 0 的类别?
例如
result (for file 1):
mode | no.cases
1 3
2 1
3 0
4 0
5 2
提前致谢,p.
【问题讨论】: