如何在 rstudio 中计算样本量 - 逻辑回归答案

【问题标题】：how to calculate the sample size in rstudio - logistic regression如何在 rstudio 中计算样本量 - 逻辑回归
【发布时间】：2021-08-20 03:41:12
【问题描述】：

如何计算 rstudio 中的样本量。我看过样本 set.seed(1000)、set.seed(888) 等。根据观察的数量是否重要？我找到了这个链接Power and sample size calculations，但我不知道该函数需要什么输入值。

例如。 power.t.test(delta=.25,sd=0.7,power=.80)

函数的输入：

n – 每组的样本量

delta – 两个总体的平均值之差

sd——标准差

power – 所需的功率，以比例形式（0 到 1 之间）

【问题讨论】：

种子不是样本大小，它是“随机”数生成器的种子，完全不是随机的。结果大致随机分布，但是是基于您开始的种子的一组序列。人们提供种子的原因是为了让其他人可以复制与他们相同的结果。

【解决方案1】：

问题中的链接指向 t.test 的功效计算，但问题涉及 logistic 回归。此外，ex.power.t.test 似乎也用于 t 检验，而不是 GLM。

功率分析一般有两种方法：

只需一点编程，您就可以轻松地自己设置模拟。

另一方面，GLM 和其他模型的功率分析可在 pwr 包中的函数 pwr.f2.test 中轻松获得。根据帮助文件：

"参数'u'、'v'、'f2'、'power'和'sig.level'中的一个必须作为NULL传递，并且该参数由其他参数确定。注意最后一个具有非 NULL 默认值，因此如果要计算它，必须显式传递 NULL。"

这是文档中的示例：

pwr.f2.test(u=5,v=89,f2=0.1/(1-0.1),sig.level=0.05)

但如果您想从幂计算显着性水平，请使用：

pwr.f2.test(u=5, v=89, f2=0.1/(1-0.1), sig.level=NULL, power=0.8)

更多细节可以在文档中找到，尤其是package vignette。

【讨论】：

【解决方案2】：

谢谢你们。我误解了链接参考。 set.seed(n) 中的 n 只是一个随机数。它不应该太频繁地设置/重置为另一个随机数。它是指定的，因此其他人可以重现相同的结果。它似乎不是基于观察次数或其他任何东西。

【讨论】：