【问题标题】:How to perform a bootstrapped paired t-test in R?如何在 R 中执行自举配对 t 检验?
【发布时间】:2016-03-03 18:03:26
【问题描述】:

我想在 R 中执行自举配对 t 检验。我已经对多个使用参数配对 t 检验时返回 p<.05 p>

   differences<-groupA-groupB
   t.test(differences) #To get the t-statistic e.g. 1.96

   Repnumber <- 10000                  
   tstat.values <- numeric(Repnumber)       
   for (i in 1:Repnumber) {
     group1 = sample(differences, size=length(differences), replace=T)
     tstat.values[i] = t.test(group1)$statistic
   }

   #### To get the bootstrap p-value compare the # of tstat.values
   greater (or lesser) than or equal to the original t-statistic divided
   by # of reps:

   sum(tstat.values<=-1.96)/Repnumber

谢谢!

【问题讨论】:

    标签: r statistics statistics-bootstrap significance statistical-test


    【解决方案1】:

    您似乎在比较苹果和橙子。对于 differences 的单个 t 检验,您将获得一个 t 统计量,如果大于临界值,则表明 group1group2 之间的差异是否显着不同于零。您的引导代码执行相同的操作,但是对于 differences 的 10,000 个引导样本,您可以估计来自 differences 总体的不同随机样本的 t 统计量的变化。如果你取这些自举 t 统计量 (mean(tstat.values)) 的平均值,你会发现它与 differences 的完整样本中的单个 t 统计量大致相同。

    sum(tstat.values&lt;=-1.96)/Repnumber 为您提供小于 -1.96 的自举 t 统计量百分比。这是对来自总体的重复随机样本中 t 统计量小于 -1.96 的时间百分比的估计值。我认为这本质上是对您的测试能力的估计,以检测给定样本大小和显着性水平的group1group2 之间给定大小的差异,尽管我不确定这样的功效分析有多稳健是。

    就正确引导 t 检验而言,我认为您实际需要做的是某种排列测试,与反复改组数据标签并执行 t 相比,检查您的实际数据是否是异常值- 对每个洗牌数据集进行测试。您可能想在 CrossValidated 上提问,以获得有关如何正确处理您的数据的建议。这些 CrossValidated 答案可能会有所帮助:hereherehere

    【讨论】:

    • 谢谢。引导时是否有必要保留对?如果没有,我可以重写它。
    猜你喜欢
    • 2015-05-17
    • 2019-02-26
    • 2018-10-09
    • 2023-01-13
    • 2013-06-02
    • 2021-05-27
    • 2020-06-25
    • 1970-01-01
    • 2023-01-31
    相关资源
    最近更新 更多