【发布时间】:2015-09-09 10:58:29
【问题描述】:
这是我的数据框:
X Y Date Qty CumSumA CumSumB
1 A B 1/1 1 1 0
2 A A 1/1 2 3 2
3 A E 1/1 2 5 2
4 B A 1/1 1 1 1
5 B B 1/1 3 4 4
6 B C 1/1 2 6 4
7 C D 1/1 2 2 2
8 C E 1/1 4 6 2
9 C A 1/1 1 7 2
10 A C 1/2 2 2 0
11 A D 1/2 3 5 0
12 A E 1/2 2 7 0
13 B A 1/2 5 5 0
14 B B 1/2 1 6 1
15 B C 1/2 2 8 1
16 C D 1/2 2 2 4
17 C E 1/2 1 1 4
18 C A 1/2 3 4 4
我用
得到 CumSumA 列library(dplyr)
data <- data %>%
group_by(Date,X) %>%
mutate(CumSumA= cumsum(Qty))
我怎样才能得到 CumSumB 列,它是上面所有行的 Qty 的累积总和,在列 @987654326 中具有 (a) 相同的 Date 值和 (b) 相同的行 X 值@。
例如,第 16 行的 X 值为 C,Date 值为 1/2。我想获得 Y 值 C 和 Date 值 1/2 的所有行的 Qty 的累积总和。所以这将是第 10 行加上第 15 行,所以 CumSumB 是 2 + 2 = 4。
请注意,X 和 Y 列有 140 多个唯一变量。
【问题讨论】: