【发布时间】:2019-04-09 21:09:28
【问题描述】:
我一直试图理解 self-attention,但我发现的所有内容都不能很好地解释这个概念。
假设我们在 NLP 任务中使用自注意力,所以我们的输入是一个句子。
然后self-attention可以用来衡量句子中每个单词对于其他单词的“重要性”程度。
问题是我不明白“重要性”是如何衡量的。重要的是什么?
self-attention 算法中训练权重的目标向量到底是什么?
【问题讨论】:
标签: machine-learning nlp artificial-intelligence attention-model