用于文本摘要的序列到序列模型的细节是什么？答案

【问题标题】：What are the details of Sequence-to-sequence model for text summarization?用于文本摘要的序列到序列模型的细节是什么？
【发布时间】：2017-09-14 16:52:00
【问题描述】：

很清楚如何训练编码器-解码器模型进行翻译：每个源序列都有其对应的目标序列（翻译）。但在文本摘要的情况下，摘要比其文章短得多。根据Urvashi Khandelwal, Neural Text Summarization ，每个源语句都有其摘要（更短或更长）。但我几乎不相信存在任何这样的数据集，其中每个句子都有相应的摘要。那么，如果我是对的，训练sunch模型的可能方法是什么？否则有没有免费的文本摘要数据集？

【问题讨论】：

您是否阅读了您链接的论文？他们在那里提到了 ACL 选集数据集。
@Aaron，我当然读过了。据我了解，它包含论文及其摘要。我说的对吗？
是的。我认为他们在实验中只使用了论文的标题和摘要。人们使用其他技巧来获取数据，例如使用简短的新闻文章和标题作为摘要。
@Aaron，所以这都是关于技巧的？

标签： nlp dataset sequence-to-sequence

【解决方案1】：

您说得对，很少有专门创建用于训练文本摘要模型的大型数据集。人们倾向于使用其他现有数据并想方设法将其转化为汇总问题。您可以阅读其他文本摘要论文以了解它们的作用。

【讨论】：

【解决方案2】：

研究倾向于使用像

这样的数据集

对amazon products 的数据集等产品的评论
以标题作为摘要的新闻，例如CNN/Daily Mail dataset 和Newsroom dataset

如果您需要了解更多关于如何有效使用这些模型的信息，这个blog series 详细介绍了如何使用最新方法训练文本摘要模型，它还在线收集了multiple implementations 并在google colab 中实现它们，因此，无论您的计算机性能如何，您都可以随时在 google colab 上免费试用这些数据集

【讨论】：