【问题标题】:Dynamic RNN: padding word vector动态RNN:填充词向量
【发布时间】:2018-10-16 09:27:15
【问题描述】:

我对填充有点困惑,我的第一个问题是:

  • 是否可以用非 0 的值填充较短的序列?那么在 RNN 中你是如何处理这个问题的呢?
  • 一般用0来填充,有什么具体原因吗?是否因为不影响计算而使训练变得容易,还是您仍然需要掩盖损失函数?

  • 如果您的句子由从 word2vec 模型嵌入的向量组成,是否会将填充作为零向量应用?

提前感谢任何提示!

【问题讨论】:

  • tf.pad 提供了使用不同常量值的选项,以及替代填充方法。按惯例经常使用零,因此以后更容易忽略填充值(用于 RNN 处理和优化);虽然你也有tf.sequence_mask

标签: tensorflow padding rnn


【解决方案1】:

How to overcome training example's different lengths when working with Word Embeddings (word2vec) 已解决您的问题。

有关交替最小/最大填充方法的详细信息,请参阅Apply word embeddings to entire document, to get a feature vector

另请参阅:keras.preprocessing.sequence.pad_sequences,它可以将值作为参数填充。

【讨论】:

  • 请不要发布对其他 Stack Exchange 问题的仅链接答案。相反,请在此处包含答案的基本部分,并针对此特定问题定制答案。
猜你喜欢
  • 2018-07-10
  • 2017-06-11
  • 2011-09-15
  • 2011-09-21
  • 1970-01-01
  • 2017-01-07
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多