【发布时间】:2018-04-19 07:13:33
【问题描述】:
我有一个包含 8 个变量的数据集,当我使用以下语法运行 dplyr 时,我的输出数据帧只有我在 dplyr 代码中使用过的变量,而我想要所有变量
ShowID<-MyData %>%
group_by(id) %>%
summarize (count=n()) %>%
filter(count==min(count))
ShowID
所以我的输出将有两个变量 - ID 和 Count。如何在新数据框中获取其余变量?为什么会发生这种情况,我对此一无所知?
> ncol(ShowID)
[1] 2
> ncol(MyData)
[1] 8
MYDATA
key ID v1 v2 v3 v4 v5 v6
0-0-70cf97 1 89 20 30 45 55 65
3ad4893b8c 1 4 5 45 45 55 65
0-0-70cf97d7 2 848 20 52 66 56 56
0-0-70cf 2 54 4 846 65 5 5
0-0-793b8c 3 56454 28 6 4 5 65
0-0-70cf98 2 8 4654 30 65 6 21
3ad4893b8c 2 89 66 518 156 16 65
0-0-70cf97d8 3 89 20 161 1 55 45465
0-0-70cf 5 89 79 48 45 55 456
0-0-793b8c 5 89 20 48 545 654 4
0-0-70cf99 6 9 20 30 45 55 65
DESIRED
key ID count v1 v2 v3 v4 v5 v6
0-0-70cf99 6 1 9 20 30 45 55 65
RESULT FROM CODE
ID count
6 1
【问题讨论】:
-
@RonakShah 添加
-
我很困惑为什么 group_by(id) 会删除所有其他变量?有人能告诉我在我的代码中的哪一步从新数据框中删除了变量吗?