【发布时间】:2014-07-17 15:52:47
【问题描述】:
当我对数据进行聚类(使用任何聚类方法)并计算质量指标(我尝试了几个指标、剪影、Dunn 等)时,我得到的分数很差。 我感兴趣的是我的数据是否可聚类?有什么方法可以评估吗?或者告诉我数据是否包含任何有用信息的方法? 谢谢, 哈米德
【问题讨论】:
标签: cluster-analysis
当我对数据进行聚类(使用任何聚类方法)并计算质量指标(我尝试了几个指标、剪影、Dunn 等)时,我得到的分数很差。 我感兴趣的是我的数据是否可聚类?有什么方法可以评估吗?或者告诉我数据是否包含任何有用信息的方法? 谢谢, 哈米德
【问题讨论】:
标签: cluster-analysis
也许它只是没有集群?
或者它们不适合由 Silhouette、Dunn 等人评估的模型 - 这些指标可能会产生很大的误导,尤其是当您的数据集中也有噪音时。不要盲目相信这些指标。
查看您的数据是否可以聚类的最佳方法是可视化。如果您无法以您看到集群的方式对其进行可视化,那么您如何期望算法返回有意义的集群?
【讨论】: