【发布时间】:2017-10-25 09:08:26
【问题描述】:
我正在训练一个线性回归模型。我使用 tf.contrib.data 准备数据集,将其打乱并分批提供:
dataset = tf.contrib.data.TFRecordDataset(filename)
dataset = dataset.map(
_parse_function, num_threads=16, output_buffer_size=100 * batch_size)
dataset = dataset.repeat(5)
dataset = dataset.shuffle(buffer_size=100000)
dataset = dataset.padded_batch(batch_size, padded_shapes=([None], [None]))
iterator = dataset.make_initializable_iterator()
x_inputs, y_ = iterator.get_next()
以下是我们的训练损失:
很奇怪,在每个 epoch 的开始(迭代 = 100k)我们在训练损失中都有一个脉冲。如果训练过程继续进行,我们会在接下来的 epoch 开始时看到相同的模式。
【问题讨论】:
-
如果您提供最少的代码来重现您的问题,那么回答起来会容易得多。但问题可能出在您的数据顺序上。
标签: machine-learning tensorflow tensorflow-datasets