【发布时间】:2021-08-17 07:09:56
【问题描述】:
如何使用多层感知器在未标记的数据集上进行 K-Means 等聚类。 我有带标签的 MNIST 数据集,但我想用 MLP 执行聚类算法。 有什么想法吗?
【问题讨论】:
-
聚类通常是无监督的,MLP 通常是有监督的。你的确切问题是什么?你能定义一个距离度量吗?你会期望 MLP 定义这样的吗?
-
@PeterLang 我想用 K-Means 之类的 MLP 对未标记数据集(无监督)进行聚类。
-
MLP 是指堆叠的线性层还是任何神经网络?感觉这里重要的是目标(kmeans'不可微),而不是架构。
-
我认为将多层感知器(“普通”神经网络)应用于未标记的数据是根本不可能的,因为神经网络通常只处理标记的数据。在未标记的数据上训练神经网络似乎没有意义。 (那时训练会是什么样子?)神经网络是监督模型(需要正确解决方案的示例,因此需要标签),但聚类通常是无监督(不需要标签)。
-
这不一定是真的,transformers 网络的预训练工作没有标签。都是关于如何定义目标任务和损失函数。
标签: python machine-learning cluster-analysis k-means mlp