【发布时间】:2019-03-16 19:08:57
【问题描述】:
我一直在尝试通过 Hmisc R 包计算二项分布的置信区间。具体来说,我使用了 binconf 函数,它完美地完成了它的工作。
library(plyr)
library(Hmisc)
Student <- c("A", "B", "C")
TP <- c(13, 36, 43)
obs.pos <- c(16, 37, 48)
df <- data.frame(Student, TP, obs.pos)
df1 <- df %>%
plyr::mutate(Sen = binconf(TP, obs.pos, alpha = 0.05, method = "wilson", return.df = TRUE))
df1 %>% View()
# Student TP obs.pos Sen.PointEst Sen.Lower Sen.Upper
#1 A 13 16 0.8125000 0.5699112 0.9340840
#2 B 36 37 0.9729730 0.8617593 0.9986137
#3 C 43 48 0.8958333 0.7783258 0.9546783
不幸的是,我觉得该函数在我的原始数据框中创建了一个数据框,并且不允许我再对我的输出应用基本函数。例如,我无法选择列(通过使用 dplyr)或舍入数字,因为 R 无法找到创建的列(例如 Sen.PointEst、Sen.Lower、Sen.Upper)。下面是我的输出结构。
df1 %>% str()
#'data.frame': 3 obs. of 4 variables:
# $ Student: Factor w/ 3 levels "A","B","C": 1 2 3
# $ TP : num 13 36 43
# $ obs.pos: num 16 37 48
# $ Sen :'data.frame': 3 obs. of 3 variables:
# ..$ PointEst: num 0.812 0.973 0.896
# ..$ Lower : num 0.57 0.862 0.778
# ..$ Upper : num 0.934 0.999 0.955
我希望将所有列都放在输出的第一级,以便我可以轻松地将所有常规函数应用于我的输出。
感谢您的帮助!
【问题讨论】:
标签: r dplyr plyr confidence-interval hmisc