【发布时间】:2018-09-10 18:58:25
【问题描述】:
我希望能够使用自举生成一些测试统计信息的置信区间。我想要做的是使用从我的原始数据集中替换的抽样来绘制一个引导数据集。我假设这将是一个大小为 n 的数据集(其中 n 小于原始数据集的大小),它对来自完整数据集的观察/数据行进行替换(以便某些行可能被绘制两次)。
我现在的单次迭代代码如下:
samp <- dat[sample(nrow(dat), 100000), ]
此代码从我的数据集 (dat) 中采样 100k 行。
我的问题如下:
此代码是否对替换行进行采样?我的假设是否正确:使用替换采样的引导数据集等效于对大小为 n 的数据集(小于原始数据集)进行采样,该数据集从完整数据集中随机抽取数据行并替换(这是带替换的引导)?
【问题讨论】:
标签: r sampling statistics-bootstrap