【发布时间】:2020-12-14 00:53:30
【问题描述】:
我正在比较不同的聚类方法。例如使用 K-means 进行凝聚聚类、从样本中进行预测等。
我在 python 中,主要使用 pandas 和 sklearn。
当然,我遇到的问题是每个算法分配给观测值的簇号都不同,我得到的结果与此类似:
我为 8 个集群手动执行此操作,但如果我有更多集群,那就是一场噩梦。
我认为这个想法是根据观察结果的共同点来重新标记结果。目前是比较相同数量的集群时应该更容易。
谢谢!
【问题讨论】:
标签: python pandas scikit-learn cluster-analysis