【发布时间】:2015-06-03 13:00:57
【问题描述】:
我有一个大数据集,其中包含许多看起来与此类似的变量:
> data.table(a=letters[1:10],b=LETTERS[1:10],ID=c(1,1,1,2,2,2,2,3,3,3))
a b ID
1: a A 1
2: b B 1
3: c C 1
4: d D 2
5: e E 2
6: f F 2
7: g G 2
8: h H 3
9: i I 3
10: j J 3
我想为每个 ID 值连接(在它们之间用换行符)除 ID 之外的所有列值,所以结果应该如下所示:
a b ID
1: a A 1
b B
c C
2: d D 2
e E
f F
g G
3: h H 3
i I
j J
我找到了一个链接R Dataframe: aggregating strings within column, across rows, by group,它讨论了如何为一列执行此操作,如何将其扩展到 .SD 中的所有列?
为了清楚起见,我将分隔符从 \n 更改为 ,,结果应如下所示:
a b ID
1: a,b,c A,B,C 1
2: d,e,f,g D,E,F,G 2
3: h,i,j H,I,J 3
【问题讨论】:
-
你想要的输出不清楚。
-
大卫 - 我改变了我原来的问题,使所需的输出清晰
标签: r data.table