【发布时间】:2019-01-21 19:54:18
【问题描述】:
我正在使用来自scikit-learn 库的k-means 算法,并且我想要聚类的值位于具有3 列的pandas 数据框中:ID、value_1 和value_2。
我想使用value_1 和value_2 对信息进行聚类,但我也想保持ID 与之关联(这样我就可以在每个聚类中创建IDs 的列表)。
这样做的最佳方法是什么?目前它也使用ID 号码进行集群,这不是本意。
我当前的代码(X 是 pandas 数据框):
kmeans = KMeans(n_clusters=2, n_init=3, max_iter=3000, random_state=1)
(X_train, X_test) = train_test_split(X[['value_1','value_2']],test_size=0.30)
kmeans = kmeans.fit(X_train)
【问题讨论】:
-
为什么不使用 kmeans 创建另一个数据框并添加 value_3 列?
标签: python pandas scikit-learn k-means