【发布时间】:2021-09-17 06:55:26
【问题描述】:
我有一个像 df 这样的数据集。我想计算每个bars_by_foo 的文本出现次数并创建my.column。非常感谢。
data <- data.frame(foo=c(1, 1, 1, 2, 2, 3, 3, 3), bar=c('a', 'a', 'b', 'a', 'b', 'b', 'c', 'd'))
data
agg <- aggregate(bar~foo, data = data, paste0, collapse="")
df <- merge(data, agg, by = "foo", all = T)
colnames(df) <- c(colnames(data), "bars_by_foo") # optional
df
预期的答案
foo bar bars_by_foo my.column
1 a aab a(2), b(1)
1 a aab a(2), b(1)
1 b aab a(2), b(1)
2 a ab a(1), b(1)
2 b ab a(1), b(1)
3 b bcd b(1), c(1), d(1)
3 c bcd b(1), c(1), d(1)
3 d bcd b(1), c(1), d(1)
【问题讨论】:
标签: r tidyverse tidyr data-manipulation