【问题标题】:Auto Text Summarization [closed]自动文本摘要[关闭]
【发布时间】:2012-09-08 19:08:57
【问题描述】:

我决定使用 Python/Django 开发一个自动文本摘要工具。

有人可以推荐有关如何入门的书籍或文章吗?

自动文本摘要中是否有任何开源算法或制作项目,以便我了解这个想法?

另外,您愿意向我推荐 Django/Python 中新的具有挑战性的 FYP 吗?

【问题讨论】:

  • 这个想法已经完成。你要找的是Summlyapp 他们甚至发布了一些API的东西,希望对你有帮助。
  • 你必须自己做。可能这不是提出想法的正确方式。
  • 在决定要开发什么之前,您没有研究过吗?
  • 这个问题可能不太适合 Stackoverflow,但关于 @Surya 的评论:应用程序存在这一事实很难证明不尝试创建更好的应用程序是合理的。此外,summly 是一个使用自然语言摘要技术的 iPhone 应用程序,但这个想法比这要古老得多,并且有一个完整的 NLP 研究分支致力于它。

标签: python django nlp summarization


【解决方案1】:

首先是 Paper,我建议:

1- 最近的自动文本摘要技术:M.Gambhir 和 V.Gupta 的一项调查
2- 文本摘要技术调查,A.Nenkova

至于 Python 的工具,我建议看看这些工具:

  1. 征服者:NLTK
  2. 王子:TextBlob
  3. 雇佣兵:斯坦福 CoreNLP
  4. 篡位者:spaCy
  5. 海军上将:gensim
    首先了解不同类型的摘要以及最适合您的摘要。此外,请记住确保您拥有适合您所针对的语言的预处理工具,因为这对摘要器的质量非常重要。

【讨论】:

    【解决方案2】:

    关于论文,我想在上一个答案中添加下一个:

    1. ChengXang Zhai 和 Sean Massung 的“文本数据管理和分析”,第 16 章。
    2. “计算机科学文本:预测文本挖掘的基础”,作者 Sholom M. Weiss, Nitin Indurkhya 和 Tong Zhang(第二版),第 9 章。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2014-01-17
      • 1970-01-01
      相关资源
      最近更新 更多