【发布时间】:2019-07-07 19:19:40
【问题描述】:
使用下面的代码,我想问一些关于下面到底发生了什么的问题。
dataset = tf.data.TFRecordDataset(filepath)
dataset = dataset.map(parse_function, num_parallel_calls=4)
dataset = dataset.repeat()
dataset = dataset.shuffle(1024)
dataset = dataset.batch(16)
iterator = dataset.make_one_shot_iterator()
1.dataset.map(parse_function, num_parallel_calls=4) - 我们在这里加载了多少条记录?多少会适合内存或某个固定数字?
2.dataset = dataset.repeat() - 我们究竟重复了什么?当前从 .1 点加载的数据?如果是这样,是不是意味着我们不会再加载其他的了?
3. shuffle 究竟是如何工作的?
4.我们可以在map之前使用repeat、shuffle和batch并处理文件路径而不是单独的文件吗?
【问题讨论】:
标签: tensorflow tensorflow-datasets tfrecord