【发布时间】:2016-08-31 15:39:47
【问题描述】:
我了解,对于常规和加权油藏采样算法,用户必须指定油藏的大小作为输入。是否有任何水库采样算法仅将项目的统一采样率作为输入,这意味着用户不知道流的大小以及生成的样本大小?我环顾四周,但没有运气。
感谢您的帮助!!
【问题讨论】:
我了解,对于常规和加权油藏采样算法,用户必须指定油藏的大小作为输入。是否有任何水库采样算法仅将项目的统一采样率作为输入,这意味着用户不知道流的大小以及生成的样本大小?我环顾四周,但没有运气。
感谢您的帮助!!
【问题讨论】:
如果您既不知道总体大小也不知道所需的样本大小,则唯一可能的流式算法是选择每个元素的概率为p。这并不能保证所选样本将完全具有 pN 元素,但它不会有偏见并且大小合适。
话虽如此,我认为很少有一个用例需要 x% 的未知人口样本。更常见的是样本的大小由处理(或存储)成本固定,在这种情况下,无论人口规模如何,水库抽样都将填充所需的样本大小。
【讨论】: