【问题标题】:Is there any corpora for automatic text summarization?是否有任何用于自动文本摘要的语料库?
【发布时间】:2016-02-07 20:18:49
【问题描述】:

我想从事与文本摘要相关的不同任务:

  • 主题/关键字提取
  • 句子提取

有哪些英语语料库可以帮助完成这项任务?

【问题讨论】:

    标签: nlp text-mining topic-modeling summarization


    【解决方案1】:

    看看TAC共享任务:http://www.nist.gov/tac/2011/Summarization/

    编辑:您可以回到过去并查看以前的 TAC/DUC 汇总共享任务。另请注意签署某些许可协议所需的一些数据。

    【讨论】:

      【解决方案2】:

      20 个新闻组数据集是热门的主题数据集。如果您使用 python,则可以使用 scikit learn 访问它。有关更多信息,请参见此处:http://scikit-learn.org/stable/datasets/twenty_newsgroups.html

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2016-05-11
        • 2020-08-05
        • 1970-01-01
        • 2012-09-08
        • 1970-01-01
        • 2013-09-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多