【发布时间】:2017-10-29 03:07:00
【问题描述】:
TextRank 是一种自动文本摘要的方法。许多人将其归类为“无监督”方法。我想知道这是否会转化为 TextRank 被归类为无监督机器学习技术。
【问题讨论】:
标签: machine-learning nlp summarization
TextRank 是一种自动文本摘要的方法。许多人将其归类为“无监督”方法。我想知道这是否会转化为 TextRank 被归类为无监督机器学习技术。
【问题讨论】:
标签: machine-learning nlp summarization
TextRank 的原作者 Mihalcea 和 Tarau 将他们的工作描述为某种意义上的unsupervised:
特别是,我们提出并评估了两种用于关键字和句子提取的创新无监督方法。
但这与unsupervised learning 不同,即在未标记的数据中查找隐藏结构。
此外,TextRank 不是machine learning 算法,换句话说,它不会通过“将损失函数与正则化项或边约束一起最小化”从数据中进行泛化(根据Stephen Boyd 等人)。语言学家可能没有一些相似之处,尽管这超出了这个问题的范围。
即便如此,TextRank 和相关方法被用于开发特征向量以呈现给机器学习算法这一事实可能会引起一些混淆。
【讨论】:
TextRank 与机器学习没有直接关系:Machine learning 涉及创建数据模型以根据先前的观察预测未来的观察。这涉及调整模型参数以适应观察到的数据。
另一方面,TextRank 是一种基于图的排序算法:它根据单个文档的结构找到摘要部分,不使用观察来学习任何东西。既然不是机器学习,也就不可能是无监督的机器学习。
【讨论】: