【发布时间】:2018-09-29 10:44:17
【问题描述】:
推荐使用tensorflow数据集作为输入管道,可设置如下:
# Specify dataset
dataset = tf.data.Dataset.from_tensor_slices((features, labels))
# Suffle
dataset = dataset.shuffle(buffer_size=1e5)
# Specify batch size
dataset = dataset.batch(128)
# Create an iterator
iterator = dataset.make_one_shot_iterator()
# Get next batch
next_batch = iterator.get_next()
我应该能够获得批量大小(来自数据集本身或从它创建的迭代器,即iterator 和next_batch)。也许有人想知道数据集或其迭代器中有多少批次。或者有多少批次已经被调用,还有多少批次留在迭代器中?可能还想一次性获取特定元素,甚至整个数据集。
我在 tensorflow 文档中找不到任何内容。这可能吗?如果没有,有谁知道这是否已作为 tensorflow GitHub 上的问题提出要求?
【问题讨论】:
标签: tensorflow issue-tracking tensorflow-datasets