【发布时间】:2021-10-09 02:53:32
【问题描述】:
关于Starting question的问题我对计算聚类中心的坐标和标记中心有疑问:
kmeans.cluster_centers_
给予
[[ 4.87744023 -0.48344163]
[ 8.29540909 6.7398487 ]
[ 1.05638163 3.84314976]]
我对中心的顺序感到困惑。第一个是“绿色”集群(图中的标签 2),第二个是“红色”集群(图中的标签 0),最后一个是“蓝色”集群,图中标签为 1。其背后的逻辑是什么?
另外,如果我将聚类数据标记为聚类的起点——例如葡萄酒质量数据集WineQuality 或 Twitter 情绪分析Twitter sentiment analisys。我知道集群的标签,并希望将它们保留为集群的标签,当然还要将它们与集群中心相关联?
【问题讨论】:
标签: nlp cluster-analysis k-means centroid