【问题标题】:Reservoir sampling without specifying a reservior size as input (only a uniform sampling ratio is specified)没有指定水库大小作为输入的水库采样(仅指定了统一的采样率)
【发布时间】:2016-08-31 15:39:47
【问题描述】:

我了解,对于常规和加权油藏采样算法,用户必须指定油藏的大小作为输入。是否有任何水库采样算法仅将项目的统一采样率作为输入,这意味着用户不知道流的大小以及生成的样本大小?我环顾四周,但没有运气。

感谢您的帮助!!

【问题讨论】:

    标签: algorithm sampling


    【解决方案1】:

    如果您既不知道总体大小也不知道所需的样本大小,则唯一可能的流式算法是选择每个元素的概率为p。这并不能保证所选样本将完全具有 pN 元素,但它不会有偏见并且大小合适。

    话虽如此,我认为很少有一个用例需要 x% 的未知人口样本。更常见的是样本的大小由处理(或存储)成本固定,在这种情况下,无论人口规模如何,水库抽样都将填充所需的样本大小。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2014-12-23
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2023-03-23
      相关资源
      最近更新 更多