【发布时间】:2021-12-10 07:41:16
【问题描述】:
我知道基本的循环格式,但我不确定如何将“总体”合并到循环中以找到收集平均值为 42 或更大的样本的概率。
使用循环找出从以下代码生成的数据集中收集平均值为 42(或更大)的样本 (n=10) 的概率:
set.seed(1)
population<-rnorm(n=500,mean=35,sd=10)
【问题讨论】:
我知道基本的循环格式,但我不确定如何将“总体”合并到循环中以找到收集平均值为 42 或更大的样本的概率。
使用循环找出从以下代码生成的数据集中收集平均值为 42(或更大)的样本 (n=10) 的概率:
set.seed(1)
population<-rnorm(n=500,mean=35,sd=10)
【问题讨论】:
解决此问题的一种方法是从population 重复采样并计算这些样本的均值大于或等于 42 的频率。
set.seed(1);
population <- rnorm(n=500, mean=35, sd=10)
nsim <- 100000 # the number of time we will do this
vec_mean <- numeric(nsim) # a vector to hold the sample means
for (i in 1:nsim) {
samp <- sample(population, size = 10, replace = TRUE)
vec_mean[i] <- mean(samp)
}
sum(vec_mean >= 42) / nsim
# [1] 0.01727
这可以解释为从该总体中收集大小为 10 且平均值为 42 或更大的样本的(常客)概率。
【讨论】: