【发布时间】:2021-01-02 12:08:07
【问题描述】:
在tensorflow tutorial 中,我看到数据集只是像这样打乱了
AUTOTUNE = tf.data.experimental.AUTOTUNE
train_ds = train_ds.cache().shuffle(1000).prefetch(buffer_size=AUTOTUNE)
但我也看到其他人的代码,例如:
ds = ds.cache()
ds = ds.repeat() # ds is a dataset
ds = ds.shuffle(buffer_size=1000)
我假设从技术上讲,数据集将在每个训练 epoch 后全部消耗,并且应该重复输入到下一个 epoch 的 shuffle 缓冲区。
但为什么第一个教程没有重复?我应该明确地调用 ds repeat 吗?
【问题讨论】:
标签: tensorflow