【问题标题】:Is attention mechanism really attention or just looking back at memory again?注意力机制真的是注意力还是只是再次回顾记忆?
【发布时间】:2019-03-03 02:08:58
【问题描述】:

在阅读注意力机制时,我对注意力一词感到困惑。它与我们通常定义中描述的注意力性质相同吗?

【问题讨论】:

标签: deep-learning attention-model


【解决方案1】:

例如在机器翻译任务中,直觉上这相当于输出一个翻译后的单词,然后返回所有文本的内部记忆,以决定接下来要生成哪个单词。这似乎是一种浪费,而不是人类正在做的事情。事实上,它更类似于内存访问,而不是注意力,在我看来这有点用词不当(更多内容见下文)。尽管如此,这并没有阻止注意力机制变得非常流行并在许多任务上表现良好。

【讨论】:

    【解决方案2】:

    注意,正如Attention Is All You Need 中所介绍的,恕我直言,它与我们的大脑用作注意机制的机制非常相似。

    我们的大脑中有一个名为 LGN 的东西,负责为手头的任务过滤掉不必要的信息。例如,如果我开始寻找我的钥匙,我的大脑将不太注意银色或金色以外的颜色(希望如此)。现在,我不知道人类大脑的更高层次的注意力机制。然而,有一点很清楚的是,信息在注意力之前通过每一层,并以神经活动的形式表示。

    当您输入世界当前状态的人工模型表示时,信息将表示为张量,同样,注意力可以让您看到做出最佳决策所需的内容(类似于查找密钥)。

    【讨论】:

    • NMT 中使用的注意力与“感官注意力”在大脑中的工作方式无关。充其量,它可以被构建为一种“响应选择”机制。前者是外生注意的一种形式(尽管它也可能是内生的),而后者纯粹是内生的——来自更高层次联想记忆网络的反馈指导下一个响应的选择(在这种情况下是单词的选择)。因此,将其称为关注是一个糟糕的选择。关于注意力的认知/神经科学/心理学研究已有 100 年历史。
    猜你喜欢
    • 1970-01-01
    • 2019-04-09
    • 2020-10-08
    • 2023-03-12
    • 2018-07-01
    • 2017-10-29
    • 1970-01-01
    • 1970-01-01
    • 2018-08-11
    相关资源
    最近更新 更多