【发布时间】:2018-07-27 14:27:51
【问题描述】:
对于有状态 LSTM,这两种方法实际上是否相同:
batch_input_shape = [1,10,2]
for _ in range(3):
x_batch, y_batch = batcher()
model.train_on_batch(x_batch, y_batch)
model.reset_states()
和
batch_input_shape = [3,10,2]
x_batch, y_batch = batcher()
model.train_on_batch(x_batch, y_batch)
model.reset_states()
即第一种方法 30 行数据分布在 3 个不同批次的 10 个序列中,reset_states() 在所有 3 个 train_on_batch() 调用之后调用。第二种方法30行数据分批提交,3个10个序列,之后立即调用reset_states()。
假设所有的数据都是一样的,抛开训练时间(第一种方法会花费更长的时间),最终的结果是一样的吗?
【问题讨论】:
标签: neural-network lstm recurrent-neural-network rnn