【问题标题】:Binomial confidence intervals of means with RR 均值的二项式置信区间
【发布时间】:2016-08-02 12:14:53
【问题描述】:

我有 4 个不同的 data.frames,它们的观察结果遵循二项分布,我需要为每个数据帧计算与第二列的平均值相关的置信区间 (Flow)。

Successtotal number of trials = 85 列中报告成功次数。

如何计算置信区间? 我怎样才能用 R 做到这一点?

这是我的 data.frames 的示例:

df1 <- read.table(text = 'Flow Success
725.661   4
25.54     4
318.481   4
230.556   4
2.823     3
12.6      3
9.891     3
11.553    1', header = TRUE)

> mean(df1$Flow)
[1] 167.1381


df2 <- read.table(text = 'Flow Success
725.661    3
25.54      3
318.481    3
230.556    2
2.823      2
12.6       1', header = TRUE)

> mean(df2$Flow)
[1] 219.2768

df3 <- read.table(text = 'Flow Success
725.661     2
25.54       2
318.481     1', header = TRUE)

> mean(df3$Flow)
[1] 356.5607

df4 <- read.table(text = 'Flow Success
725.661    2
25.54      2', header = TRUE)

> mean(df4$Flow)
[1] 375.6005

我需要计算上述均值的置信区间。

如果需要,我可以为您提供有关数据的更多信息。

感谢任何愿意帮助我的人。

【问题讨论】:

  • 当你的观察结果都不是整数时,它们如何服从二项分布?
  • 每个观察都连接到具有整数值的第二列。感谢您的评论。
  • @user6644063 “连接到第二列”是什么意思?你有多少观察。您呈现数据的方式非常混乱。
  • 我更新了我的问题,很抱歉不太清楚。

标签: r mean confidence-interval


【解决方案1】:

binom 提供了计算二项式置信区间的方法。可以选择使用所有可用的方法,或指定一种方法。

x 给出成功次数,n 给出伯努利试验次数。

library(binom)

binom.confint(x = 5, n = 10)
          method x  n mean     lower     upper
1  agresti-coull 5 10  0.5 0.2365931 0.7634069
2     asymptotic 5 10  0.5 0.1901025 0.8098975
3          bayes 5 10  0.5 0.2235287 0.7764713
4        cloglog 5 10  0.5 0.1836056 0.7531741
5          exact 5 10  0.5 0.1870860 0.8129140
6          logit 5 10  0.5 0.2245073 0.7754927
7         probit 5 10  0.5 0.2186390 0.7813610
8        profile 5 10  0.5 0.2176597 0.7823403
9            lrt 5 10  0.5 0.2176212 0.7823788
10     prop.test 5 10  0.5 0.2365931 0.7634069
11        wilson 5 10  0.5 0.2365931 0.7634069

binom.confint(x = 5, n = 10, method = "exact")
  method x  n mean    lower    upper
1  exact 5 10  0.5 0.187086 0.812914

【讨论】:

  • 感谢@r.bot。我已经知道并使用了 binom 包..但是你认为它代表了计算 CI 的最佳方法吗?
  • 我认为它适用于二项式数据。我认为您可以安装一个仅截距的 glm 并对输出求幂,但这似乎不必要地复杂。我不明白您的问题示例中的数据结构。您对 Imo 的评论指出,每个观察都有第二列 - 一个整数。目前尚不清楚这是指试验次数还是成功次数。你仍然需要两者。
  • 抱歉我的问题不太清楚,但这是我仍然需要很好理解的东西(因此是我的问题)。第二列是指成功的次数。我应该通过首先考虑第二列然后将它们相乘或相加来计算 CI 吗(通过第一列获得)? ...我会更新我的问题
猜你喜欢
  • 2014-03-10
  • 2023-01-25
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2019-01-18
  • 2018-01-22
相关资源
最近更新 更多