【发布时间】:2018-10-16 09:27:15
【问题描述】:
我对填充有点困惑,我的第一个问题是:
- 是否可以用非 0 的值填充较短的序列?那么在 RNN 中你是如何处理这个问题的呢?
一般用0来填充,有什么具体原因吗?是否因为不影响计算而使训练变得容易,还是您仍然需要掩盖损失函数?
如果您的句子由从 word2vec 模型嵌入的向量组成,是否会将填充作为零向量应用?
提前感谢任何提示!
【问题讨论】:
-
tf.pad提供了使用不同常量值的选项,以及替代填充方法。按惯例经常使用零,因此以后更容易忽略填充值(用于 RNN 处理和优化);虽然你也有tf.sequence_mask。
标签: tensorflow padding rnn