【发布时间】:2019-12-02 14:49:22
【问题描述】:
假设您有一个很大的 df,并且您想要一种简单快速的方法来从 df(一个大型 R 数据帧)获取 df1:
df:
index var1 var2 var3 var4
0 2 4 8 7
1 2 3 9 6
2 1 5 10 8
2 1 5 7 8
2 2 9 33 10
2 2 9 17 10
3 3 6 6 9
3 4 7 11 10
这个想法是聚合(通过总和)具有相同索引和相同 var1 的行而不更改其他行。请注意,每个索引 var2 组合的 var4 都是相同的。
df1:
index var1 var2 var3 var4
0 2 4 8 7
1 2 3 9 6
2 1 5 17 8
2 2 9 50 10
3 3 6 6 9
3 4 7 11 10
【问题讨论】:
-
你只想总结列
var3?如果其他列在聚合中不是唯一的或者每个组是唯一的,那么它们应该如何处理? -
this question 是关于如何对 1 列求和,按另外 1 列分组。您的问题是关于如何对 m 列求和,按其他 n 列(m 和 n > 1)分组,但是那里的大多数答案也可以用于您的情况(m 和 n > 1)。
-
是 @GKi ,其他列是唯一的。每个 var1 组。另外,这就是 IceCreamToucan 所说的,按其他 n 列分组(m 和 n>1)
-
好的。然后您也可以使用它们进行分组以将它们保留在输出中。
标签: r dataframe group-by aggregate tidy