【发布时间】:2012-10-14 09:20:13
【问题描述】:
我在机器学习或集群方面没有太多经验,所以我对如何解决这个问题有点茫然。我感兴趣的数据由 4 列组成,其中一列只是一个 id。其他 3 个包含数值数据,值 >= 0。我需要的聚类实际上非常简单,我可以手动完成,但稍后会变得不太清楚,所以我想从正确的过程开始。我需要 6 个集群,它们取决于 3 列(称为 A、B 和 C),如下所示:
A B C Cluster
---- ---- -------- -------
0 0 0 0
0 0 >0 1
0 >0 <=B 2
0 >0 >B 3
>0 any <=(A+B) 4
>0 any >(A+B) 5
在这个阶段,这些集群将提供对数据的洞察力,为进一步分析提供信息。
由于我对此很陌生,所以我对各种聚类算法的了解还不够,所以我真的不知道从哪里开始。谁能建议一个合适的模型来使用,或者我可以研究的一些模型。
【问题讨论】:
标签: classification cluster-analysis data-mining decision-tree rapidminer