【发布时间】:2015-09-10 15:16:12
【问题描述】:
我似乎找到了很多基于计算质心和聚类的文档,但是如果我自己分配质心值呢。
假设我提供 14 个不同的质心向量。我将如何将我的数据聚类到这 14 个不同的质心值?
也许这是一个简单的问题,但我没有在网上找到答案,所以想确定一下。
【问题讨论】:
我似乎找到了很多基于计算质心和聚类的文档,但是如果我自己分配质心值呢。
假设我提供 14 个不同的质心向量。我将如何将我的数据聚类到这 14 个不同的质心值?
也许这是一个简单的问题,但我没有在网上找到答案,所以想确定一下。
【问题讨论】:
如果质心是预定义的,那么您是在进行最近邻分类,而不是聚类。只有在结构未预定义的情况下才会进行聚类。
【讨论】:
不确定这是否属于 python 论坛,但您只需要计算每个点到每个质心的距离,然后将每个点分配给最接近的质心。然后你就有了你的集群,虽然有些可能是空的(不能保证一个质心至少有一个最接近它的数据点)。您可以通过迭代所有点来做到这一点,或者使用带有 numpy.如果您需要一个示例来开始,我会在某处找到一些代码。
【讨论】: