【问题标题】:How to use summarize and group_by?如何使用summary 和group_by?
【发布时间】:2019-09-01 18:45:21
【问题描述】:

数据阵营:提示:使用函数 filter、group_by、summary 和管道 %>% 分别计算每个年龄组的女性收缩压的平均值和标准差。 在summary中,将收缩压(BPSysAve)的平均值和标准差保存为average和standard_deviation。

我的代码:

library(dplyr)
library(NHANES)
data(NHANES)

任务:用group_bysummarize完成一行

NHANES %>%
 filter(Gender == "female") %>%
 group_by(AgeDecade) %>%
 summarize(average = mean(BPSysAve, na.rm = TRUE),
           standard_diviation = sd(BPSysAve, na.rm = TRUE)) %>%
 na.omit()

不明白我的代码有什么问题。数据阵营不接受。

【问题讨论】:

  • 怎么了?它会抛出错误吗?
  • standard_deviation 的错字吗? na.omit() 不需要 imo。

标签: r dplyr


【解决方案1】:

这样的?

 NHANES %>%
  filter(Gender == "female") %>%
  group_by(AgeDecade) %>%
  summarize(average = mean(BPSysAve, na.rm = TRUE),
       standard_diviation = sd(BPSysAve, na.rm = TRUE)) %>%
   .[complete.cases(.),]

问题是最终输出中只有 3 个变量。代码中的最后一行可以替换为“filter(!is.na(AgeDecade))”,否则您不太可能有 NA。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-11-06
    • 1970-01-01
    • 2017-02-22
    • 2022-01-13
    • 1970-01-01
    • 2016-07-15
    • 2021-11-15
    • 1970-01-01
    相关资源
    最近更新 更多