【发布时间】:2016-04-12 17:26:19
【问题描述】:
我尝试使用 RNN(特别是 LSTM)进行序列预测。但是,我遇到了可变序列长度的问题。例如,
sent_1 = "I am flying to Dubain"
sent_2 = "I was traveling from US to Dubai"
我正在尝试使用基于 Benchmark for building a PTB LSTM model 的简单 RNN 预测当前单词之后的下一个单词。
但是,num_steps 参数(用于展开到先前的隐藏状态)在每个 Tensorflow 的 epoch 中应该保持不变。基本上,批处理句子是不可能的,因为句子的长度不同。
# inputs = [tf.squeeze(input_, [1])
# for input_ in tf.split(1, num_steps, inputs)]
# outputs, states = rnn.rnn(cell, inputs, initial_state=self._initial_state)
在这里,num_steps 需要在我的情况下为每个句子进行更改。我尝试了几种 hack,但似乎没有任何效果。
【问题讨论】:
-
链接需要谷歌账户才能阅读。
标签: python tensorflow lstm recurrent-neural-network