我是否需要为抽象摘要模型的源词汇和目标词汇创建单独的嵌入矩阵？

【问题标题】：Do I need to create separate embedding matrices for source and target vocab for abstractive summarization model?我是否需要为抽象摘要模型的源词汇和目标词汇创建单独的嵌入矩阵？
【发布时间】：2021-06-28 13:01:24
【问题描述】：

我正在开发一个 Seq2Seq 模型，以使用 Glove 预训练的词嵌入来执行抽象摘要。是否需要我制作两个嵌入矩阵？一个涵盖源词汇表，一个涵盖摘要词汇表。

【问题讨论】：

标签： stanford-nlp seq2seq

【解决方案1】：

不，通常的做法是共享嵌入矩阵，即使在机器翻译中单词来自不同语言。

有时，在生成模型输出时，嵌入矩阵也用作输出投影矩阵（参见例如Attention is all you need paper），但是，这只有在您使用数万个（子）词的词汇表时才有可能与 GloVe 的庞大词汇量相反。

【讨论】：

感谢您澄清此 Jindřich。我会赞成您的回答，但我还没有声誉。再次感谢