【发布时间】:2018-09-19 20:11:48
【问题描述】:
假设我有 N tf.data.Datasets 和 N 个概率列表(总和为 1),现在我想创建数据集,以便示例从具有给定概率的 N 个数据集中采样。
我希望这适用于任意概率 -> 每个数据集中具有固定数量示例的简单 zip/concat/flatmap 可能不是我想要的。
在 TF 中可以做到这一点吗?谢谢!
【问题讨论】:
-
您对使用所有数据不感兴趣吗?我在问,因为如果你是,概率只会影响生成示例的顺序(因为最终所有样本都将从所有数据集中生成)。您能否澄清您在这方面的问题?
-
我假设每个数据集无限重复,因此较小的数据集可以循环多次,然后“完成”较大的数据集。
标签: python tensorflow tensorflow-datasets