如何使用summary 和group_by？答案

【问题标题】：How to use summarize and group_by?如何使用summary 和group_by？
【发布时间】：2019-09-01 18:45:21
【问题描述】：

数据阵营：提示：使用函数 filter、group_by、summary 和管道 %>% 分别计算每个年龄组的女性收缩压的平均值和标准差。在summary中，将收缩压（BPSysAve）的平均值和标准差保存为average和standard_deviation。

我的代码：

library(dplyr)
library(NHANES)
data(NHANES)

任务：用group_by和summarize完成一行

NHANES %>%
 filter(Gender == "female") %>%
 group_by(AgeDecade) %>%
 summarize(average = mean(BPSysAve, na.rm = TRUE),
           standard_diviation = sd(BPSysAve, na.rm = TRUE)) %>%
 na.omit()

不明白我的代码有什么问题。数据阵营不接受。

【问题讨论】：

怎么了？它会抛出错误吗？
是standard_deviation 的错字吗？ na.omit() 不需要 imo。

标签： r dplyr

【解决方案1】：

这样的？

 NHANES %>%
  filter(Gender == "female") %>%
  group_by(AgeDecade) %>%
  summarize(average = mean(BPSysAve, na.rm = TRUE),
       standard_diviation = sd(BPSysAve, na.rm = TRUE)) %>%
   .[complete.cases(.),]

问题是最终输出中只有 3 个变量。代码中的最后一行可以替换为“filter(!is.na(AgeDecade))”，否则您不太可能有 NA。

【讨论】：