如何不让 dplyr 变异计算缺失组答案

【问题标题】：How to not make dplyr mutate calculate for missing group如何不让 dplyr 变异计算缺失组
【发布时间】：2019-06-14 08:05:44
【问题描述】：

我的数据如下所示：

df=data.frame(a=1:6,b=rep(c("one","two"),each=3))
df[2,2]<-NA

我想计算每一行的每组的平均值，如下所示：

df %>% group_by(b) %>% mutate(mean=mean(a))

问题在于 R 将 NA 视为一个组。期望的输出是

平均=c(2,NA,2,5,5,5)。

尝试：

df %>% group_by(b) %>% mutate(mean=if_else(b==NA,NA,mean(a)))

但这会引发错误

【问题讨论】：

【解决方案1】：

试试

df %>% group_by(b) %>% mutate(mean=mean(a)) %>% mutate(mean = if_else(is.na(b), NA_real_, mean))

【讨论】：

【解决方案2】：

如果您想避免错误消息：

library(hablar)

df %>% 
  convert(chr(b)) %>% 
  group_by(b) %>% 
  mutate(mean = if_else_(!is.na(b), mean(a), NA))

【讨论】：