TextRank 算法可以归类为无监督机器学习吗？答案

【问题标题】：Can the TextRank Algorithm be categorized as unsupervised machine learning?TextRank 算法可以归类为无监督机器学习吗？
【发布时间】：2017-10-29 03:07:00
【问题描述】：

TextRank 是一种自动文本摘要的方法。许多人将其归类为“无监督”方法。我想知道这是否会转化为 TextRank 被归类为无监督机器学习技术。

【问题讨论】：

标签： machine-learning nlp summarization

【解决方案1】：

TextRank 的原作者 Mihalcea 和 Tarau 将他们的工作描述为某种意义上的unsupervised：

特别是，我们提出并评估了两种用于关键字和句子提取的创新无监督方法。

但这与unsupervised learning 不同，即在未标记的数据中查找隐藏结构。

此外，TextRank 不是machine learning 算法，换句话说，它不会通过“将损失函数与正则化项或边约束一起最小化”从数据中进行泛化（根据Stephen Boyd 等人）。语言学家可能没有一些相似之处，尽管这超出了这个问题的范围。

即便如此，TextRank 和相关方法被用于开发特征向量以呈现给机器学习算法这一事实可能会引起一些混淆。

【讨论】：

我问这个问题的原因是因为我需要弄清楚，因为有相互矛盾的意见。我读过将 PageRank 视为机器学习的论文。更重要的是图上的机器学习（有时称为图分析）。本书还认为它是无监督机器学习 Friedman, J., Hastie, T., & Tibshirani, R. (2001)。统计学习的要素（第 1 卷，第 241-249 页）。纽约：Springer 统计系列。据我了解，机器学习不应与特定的数据表示形式联系在一起。
到目前为止，我最推荐的关于机器学习的书籍是 Pedro Domingos（华盛顿大学）goodreads.com/book/show/24612233-the-master-algorithm 撰写的 The Master Algorithm——对于什么是/isn 的最佳概述不是机器学习。

【解决方案2】：

TextRank 与机器学习没有直接关系：Machine learning 涉及创建数据模型以根据先前的观察预测未来的观察。这涉及调整模型参数以适应观察到的数据。

另一方面，TextRank 是一种基于图的排序算法：它根据单个文档的结构找到摘要部分，不使用观察来学习任何东西。既然不是机器学习，也就不可能是无监督的机器学习。

【讨论】：