【问题标题】:What are the details of Sequence-to-sequence model for text summarization?用于文本摘要的序列到序列模型的细节是什么?
【发布时间】:2017-09-14 16:52:00
【问题描述】:

很清楚如何训练编码器-解码器模型进行翻译:每个源序列都有其对应的目标序列(翻译)。但在文本摘要的情况下,摘要比其文章短得多。根据Urvashi Khandelwal, Neural Text Summarization ,每个源语句都有其摘要(更短或更长)。但我几乎不相信存在任何这样的数据集,其中每个句子都有相应的摘要。那么,如果我是对的,训练sunch模型的可能方法是什么?否则有没有免费的文本摘要数据集?

【问题讨论】:

  • 您是否阅读了您链接的论文?他们在那里提到了 ACL 选集数据集。
  • @Aaron,我当然读过了。据我了解,它包含论文及其摘要。我说的对吗?
  • 是的。我认为他们在实验中只使用了论文的标题和摘要。人们使用其他技巧来获取数据,例如使用简短的新闻文章和标题作为摘要。
  • @Aaron,所以这都是关于技巧的?

标签: nlp dataset sequence-to-sequence


【解决方案1】:

您说得对,很少有专门创建用于训练文本摘要模型的大型数据集。人们倾向于使用其他现有数据并想方设法将其转化为汇总问题。您可以阅读其他文本摘要论文以了解它们的作用。

【讨论】:

    【解决方案2】:

    研究倾向于使用像

    这样的数据集

    如果您需要了解更多关于如何有效使用这些模型的信息,这个blog series 详细介绍了如何使用最新方法训练文本摘要模型,它还在线收集了multiple implementations 并在google colab 中实现它们,因此,无论您的计算机性能如何,您都可以随时在 google colab 上免费试用这些数据集

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2020-11-28
      • 2017-12-28
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2022-01-23
      • 1970-01-01
      相关资源
      最近更新 更多