【发布时间】:2014-02-08 19:44:27
【问题描述】:
我今天提出的问题相当多。
我想计算两个数据框 infert_control 和 @ 的 置信区间(99% 水平,而不是 95)变量年龄的平均值 987654322@哪里:
infert_control = subset(infert$age, infert$case == 0)
infert_patient = subset(infert$age, infert$case == 1)
infert 是一个内置的 R 数据集,不熟悉的人,这里是:case 0表示对照组患者,case 1实际的。
> infert
education age parity induced case spontaneous stratum pooled.stratum
1 0-5yrs 26 6 1 1 2 1 3
2 0-5yrs 42 1 1 1 0 2 1
3 0-5yrs 39 6 2 1 0 3 4
4 0-5yrs 34 4 2 1 0 4 2
5 6-11yrs 35 3 1 1 1 5 32
6 6-11yrs 36 4 2 1 1 6 36
7 6-11yrs 23 1 0 1 0 7 6
8 6-11yrs 32 2 0 1 0 8 22
9 6-11yrs 21 1 0 1 1 9 5
10 6-11yrs 28 2 0 1 0 10 19
11 6-11yrs 29 2 1 1 0 11 20
...
239 12+ yrs 38 6 0 0 2 74 63
240 12+ yrs 26 2 1 0 1 75 49
241 12+ yrs 31 1 1 0 0 76 45
242 12+ yrs 31 2 0 0 1 77 53
243 12+ yrs 25 1 0 0 1 78 41
244 12+ yrs 31 1 0 0 1 79 45
245 12+ yrs 34 1 0 0 0 80 47
246 12+ yrs 35 2 2 0 0 81 54
247 12+ yrs 29 1 0 0 1 82 43
248 12+ yrs 23 1 0 0 1 83 40
解决这个问题的正确方法是什么?
我已经计算了 age 列的平均值 infert_control 和 infert_patient,加上每个子集的标准差。
【问题讨论】:
-
这是一个统计问题。但是您可以报告正确的
quantiles -
也许
t.test可以帮助你? -
@Fernando 因为
t.test()在本练习的第二部分中是必需的,所以我认为我不应该在这部分使用它,这是第一部分。这整件事是一个介绍 R 的任务。 -
我明白了,也许您可以检查 ?t.test 以查看实现细节。
-
@Fernando 我不相信
t.test()与我的问题有关。
标签: r dataset statistics confidence-interval