【发布时间】:2020-09-13 21:45:28
【问题描述】:
我有一个大型数据集,我按年份对数据集进行分组并选择 7 个变量,然后我使用 summarise,尝试按组获取每个变量的统计信息。但我只得到每组的统计数据,而不是每个变量的统计数据。我如何解释结果?我怎样才能得到每个变量的结果?
v<-colnames(Cashflow)[c(2,4:ncol(Cashflow))]
Cstats<-Cashflow%>%
group_by(Y)%>%
summarise(mean = mean(get(v),na.rm = TRUE),
observation = n(),
sd = sd(get(v),na.rm = TRUE),
min = min(get(v),na.rm = TRUE),
q25 = quantile(get(v),probs = c(0.25),na.rm = TRUE),
median = median(get(v),na.rm = TRUE),
q75 = quantile(get(v),probs = c(0.75),na.rm = TRUE),
max = max(get(v),na.rm = TRUE))```
而我的结果是这样的:
year mean sd min
1997 1 2 3
1998 2 3 4
一旦我添加了 for 循环:
for (name in v){
Cashflow%>%
group_by(Y)%>%
summarise(mean = mean(get(name),na.rm = TRUE),
observation = n(),
sd = sd(get(name),na.rm = TRUE),
我得到错误:
summarise()取消分组输出(用.groups参数覆盖)
summarise()取消分组输出(用.groups参数覆盖)
summarise()取消分组输出(用.groups参数覆盖)
有人可以给我一些建议吗?
【问题讨论】:
-
这不是错误。只是一个友好的警告。您可以使用
groups = 'drop'或summarise中的其他选项将其删除
标签: r