【发布时间】:2020-01-18 17:01:15
【问题描述】:
我正在对几个地理纬度/经度点进行 k-means 聚类,具有固定数量的组。这个基本的聚类工作得很好。
但是我有另一个变量(每个点一个),我希望 k-means 聚类来解释。这有可能吗?
聚类数据可能如下所示:
Lat: [1.23, 2.12, 3.65, 4.32, 5.63, 5.43]
Lon: [1.43, 2.43, 3.76, 4.43, 5.25, 1.75]
Extra variable: [20, 20, 10, 10, 10, 10]
如果我想将上述数据分成 2 组,并且每组的额外变量的总和不能超过 40 的总和,我该怎么做? (如果有可能的话——我对 k-means 的理解非常基础/低端。)
【问题讨论】:
-
你能分享代码吗?到目前为止你尝试了什么,突出显示你得到的错误?
-
我没有收到任何错误。我只是无法弄清楚使用哪种方法/方法来获取 k-means 分组中包含的额外变量。既不是软限制(考虑到它)也不是硬限制(截止点为 40 的总和)。如果需要,这是我的 kmeans 启动代码:
kmeans = KMeans(n_clusters=2, random_state=0, init="k-means++").fit(lat_lon_numpy_array)
标签: python math scikit-learn k-means