【问题标题】:how to calculate the sample size in rstudio - logistic regression如何在 rstudio 中计算样本量 - 逻辑回归
【发布时间】:2021-08-20 03:41:12
【问题描述】:

如何计算 rstudio 中的样本量。我看过样本 set.seed(1000)、set.seed(888) 等。根据观察的数量是否重要?我找到了这个链接Power and sample size calculations,但我不知道该函数需要什么输入值。

例如。 power.t.test(delta=.25,sd=0.7,power=.80)

函数的输入:

n – 每组的样本量

delta – 两个总体的平均值之差

sd——标准差

power – 所需的功率,以比例形式(0 到 1 之间)

【问题讨论】:

  • 种子不是样本大小,它是“随机”数生成器的种子,完全不是随机的。结果大致随机分布,但是是基于您开始的种子的一组序列。人们提供种子的原因是为了让其他人可以复制与他们相同的结果。

标签: r logistic-regression


【解决方案1】:

问题中的链接指向 t.test 的功效计算,但问题涉及 logistic 回归。此外,ex.power.t.test 似乎也用于 t 检验,而不是 GLM。

功率分析一般有两种方法:

  1. 使用特定方法的公式进行确定性估计,通常带有优化步骤
  2. 使用给定方法和一定数量的试验进行模拟,例如1000. 在后一种情况下,样本大小很重要,而且随机数生成器的初始化也很重要,用set.seed 指定。

只需一点编程,您就可以轻松地自己设置模拟。

另一方面,GLM 和其他模型的功率分析可在 pwr 包中的函数 pwr.f2.test 中轻松获得。根据帮助文件:

"参数'u'、'v'、'f2'、'power'和'sig.level'中的一个必须作为NULL传递,并且该参数由其他参数确定。注意最后一个具有非 NULL 默认值,因此如果要计算它,必须显式传递 NULL。"

这是文档中的示例:

pwr.f2.test(u=5,v=89,f2=0.1/(1-0.1),sig.level=0.05)

但如果您想从幂计算显着性水平,请使用:

pwr.f2.test(u=5, v=89, f2=0.1/(1-0.1), sig.level=NULL, power=0.8)

更多细节可以在文档中找到,尤其是package vignette

【讨论】:

    【解决方案2】:

    谢谢你们。我误解了链接参考。 set.seed(n) 中的 n 只是一个随机数。它不应该太频繁地设置/重置为另一个随机数。它是指定的,因此其他人可以重现相同的结果。它似乎不是基于观察次数或其他任何东西。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-08-24
      • 2017-07-21
      • 2018-02-22
      • 1970-01-01
      • 2018-07-26
      相关资源
      最近更新 更多