【发布时间】:2019-10-14 16:31:25
【问题描述】:
您好,我是 Python 新手,并试图在下面弄清楚这些。非常感谢任何帮助。谢谢
- 如何使用 python 在 kmeans 中获取集群内和集群间距离?
- 如何验证集群的质量?有什么措施可以检查形成的集群的好坏?
- 有没有办法找出哪些因素/变量是影响聚类的最重要特征 - 特征提取/选择
我对上面的问题 1 进行了尝试,这是正确的方法吗??
dists = euclidean_distances(km.cluster_centers_)
tri_dists = dists[np.triu_indices(4, 1)]
max_dist, avg_dist, min_dist = tri_dists.max(), tri_dists.mean(), tri_dists.min()
print(max_dist, avg_dist, min_dist)
【问题讨论】:
标签: python scikit-learn cluster-analysis