【发布时间】:2017-02-17 20:31:42
【问题描述】:
我有一个从关系数据库导出的大型数据框。我想根据主键列返回唯一行,同时结合所有其他行的观察结果。我尝试使用 collect() 来做到这一点,但到目前为止还没有运气。这是原始数据框的简化示例:
library(dplyr)
key <- c(rep(seq(1:3), 2))
x <- c("a", "b", "c", "d", "e", "f")
y <- rep(c("foo", "bar"), 3)
df <- data_frame(key, x, y)
df
key x y
<int> <chr> <chr>
1 1 a foo
2 2 b bar
3 3 c foo
4 1 d bar
5 2 e foo
6 3 f bar
还有我想返回的数据框:
df
key x y
<int> <chr> <chr>
1 1 a, d foo, bar
2 2 b, e bar, foo
3 3 c, f foo, bar
我试过了
【问题讨论】:
-
df %>% group_by(key) %>% summarise(x = toString(x), y = toString(y))?或者只是df %>% group_by(key) %>% summarise_all(toString)?