如何在 R 中执行自举配对 t 检验？答案

【问题标题】：How to perform a bootstrapped paired t-test in R?如何在 R 中执行自举配对 t 检验？
【发布时间】：2016-03-03 18:03:26
【问题描述】：

我想在 R 中执行自举配对 t 检验。我已经对多个使用参数配对 t 检验时返回 p<.05 p>

   differences<-groupA-groupB
   t.test(differences) #To get the t-statistic e.g. 1.96

   Repnumber <- 10000                  
   tstat.values <- numeric(Repnumber)       
   for (i in 1:Repnumber) {
     group1 = sample(differences, size=length(differences), replace=T)
     tstat.values[i] = t.test(group1)$statistic
   }

   #### To get the bootstrap p-value compare the # of tstat.values
   greater (or lesser) than or equal to the original t-statistic divided
   by # of reps:

   sum(tstat.values<=-1.96)/Repnumber

谢谢！

【问题讨论】：

标签： r statistics statistics-bootstrap significance statistical-test

【解决方案1】：

您似乎在比较苹果和橙子。对于 differences 的单个 t 检验，您将获得一个 t 统计量，如果大于临界值，则表明 group1 和 group2 之间的差异是否显着不同于零。您的引导代码执行相同的操作，但是对于 differences 的 10,000 个引导样本，您可以估计来自 differences 总体的不同随机样本的 t 统计量的变化。如果你取这些自举 t 统计量 (mean(tstat.values)) 的平均值，你会发现它与 differences 的完整样本中的单个 t 统计量大致相同。

sum(tstat.values<=-1.96)/Repnumber 为您提供小于 -1.96 的自举 t 统计量百分比。这是对来自总体的重复随机样本中 t 统计量小于 -1.96 的时间百分比的估计值。我认为这本质上是对您的测试能力的估计，以检测给定样本大小和显着性水平的group1 和group2 之间给定大小的差异，尽管我不确定这样的功效分析有多稳健是。

就正确引导 t 检验而言，我认为您实际需要做的是某种排列测试，与反复改组数据标签并执行 t 相比，检查您的实际数据是否是异常值- 对每个洗牌数据集进行测试。您可能想在 CrossValidated 上提问，以获得有关如何正确处理您的数据的建议。这些 CrossValidated 答案可能会有所帮助：here、here 和 here。

【讨论】：

谢谢。引导时是否有必要保留对？如果没有，我可以重写它。