【发布时间】:2018-01-04 03:11:32
【问题描述】:
我正在尝试计算 RStudio 中出生体重数据集 (birthwt) 的描述性统计数据。但是,我只对几个变量感兴趣:age、ftv、ptl 和 lwt。
这是我目前的代码:
library(MASS)
library(dplyr)
data("birthwt")
grouped <- group_by(birthwt, age, ftv, ptl, lwt)
summarise(grouped,
mean = mean(bwt),
median = median(bwt),
SD = sd(bwt))
它给了我一张印刷精美的表格,但只有有限数量的 SD 被填满,其余的说 NA。我只是不知道为什么或如何解决它!
【问题讨论】:
-
代码中的哪个位置?
-
原因是大多数情况下您只有一个观察值,即
grouped %>% summarise(n = n())和sd需要多个观察值,否则返回 NaN -
对不起,我不明白!
-
可以查看
?sd写成The standard deviation of a length-one vector is NA.部分组的元素个数为1。
标签: r dplyr standard-deviation