【发布时间】:2020-11-28 02:22:34
【问题描述】:
我使用 HuggingFace 的 Transformers 库来构建基于 BART 和 T5 的序列到序列模型。我仔细阅读了文档和研究论文,但我找不到解码器的输入 (decoder_input_ids) 应该用于序列到序列任务。
两个模型(BART 和 T5)的解码器输入应该与 lm_labels(LM 头的输出)相同还是应该与 input_ids(编码器的输入)相同?
【问题讨论】:
-
decoder_input_ids 是来自 huggingface 的标签(即目标)training documentation。
标签: nlp huggingface-transformers