【发布时间】:2018-06-18 09:38:05
【问题描述】:
我遇到的一些教程描述了使用随机初始化的嵌入矩阵,然后使用tf.nn.embedding_lookup 函数来获取整数序列的嵌入。我的印象是,由于embedding_matrix 是通过tf.get_variable 获得的,优化器会添加适当的 ops 来更新它。
我不明白的是,反向传播是如何通过查找功能发生的,这似乎是硬而不是软。这个操作的梯度是多少?它的输入 ID 之一?
【问题讨论】:
标签: tensorflow nlp deep-learning word-embedding sequence-to-sequence