【发布时间】:2013-06-17 14:23:28
【问题描述】:
我有一个 6x1000 二进制数据的数据集(6 个数据点,1000 个布尔维度)。
我对其进行聚类分析
[idx, ctrs] = kmeans(x, 3, 'distance', 'hamming');
我得到了三个集群。如何可视化我的结果?
我有 6 行数据,每行有 1000 个属性;其中 3 个在某种程度上应该是相似的或相似的。应用聚类将显示聚类。因为我知道集群的数量 我只需要找到类似的行。汉明距离告诉我们行之间的相似性,结果是正确的,有 3 个簇。
[编辑:对于任何合理的数据,kmeans 总是会找到询问的数字 集群]
我想学习这些知识 并使其易于观察和理解,而无需编写大量解释。
Matlab 的示例不适合,因为它处理数值二维数据,而我的问题涉及 n 维分类数据。
数据集在这里http://pastebin.com/cEWJfrAR
[EDIT1:如何检查集群是否重要?]
欲了解更多信息,请访问以下链接: https://chat.stackoverflow.com/rooms/32090/discussion-between-oleg-komarov-and-justcurious
如果问题不清楚,请询问您遗漏的任何内容。
【问题讨论】:
-
你不喜欢
kmeans()文档中示例的哪一部分? -
您需要提供一个最小的工作示例,而不需要回答者过多的努力。我对你的问题很感兴趣,复制粘贴所有未格式化的数据根本不可行。
-
您的问题被否决了,因为您不太清楚您要做什么。该文档提供了有关如何可视化数据的示例。如果这对您不起作用,您应该将其包含在您的问题中,并评论为什么我不适用于您的情况。提供你为什么要做你正在做的事情的背景可以让你“跳出框框”来回答——也许你的方法不是解决手头问题的最佳方法。最后:考虑this website on how to ask good questions。
-
您的问题应该尽可能独立,不需要人们阅读大量外部资源。
标签: matlab binary machine-learning cluster-analysis k-means