使用 RapidMiner 设计聚类过程答案

【问题标题】：Designing a clustering process using RapidMiner使用 RapidMiner 设计聚类过程
【发布时间】：2012-10-14 09:20:13
【问题描述】：

我在机器学习或集群方面没有太多经验，所以我对如何解决这个问题有点茫然。我感兴趣的数据由 4 列组成，其中一列只是一个 id。其他 3 个包含数值数据，值 >= 0。我需要的聚类实际上非常简单，我可以手动完成，但稍后会变得不太清楚，所以我想从正确的过程开始。我需要 6 个集群，它们取决于 3 列（称为 A、B 和 C），如下所示：

A    B    C        Cluster
---- ---- -------- -------
0    0    0        0
0    0    >0       1
0    >0   <=B      2
0    >0   >B       3
>0   any  <=(A+B)  4
>0   any  >(A+B)   5

在这个阶段，这些集群将提供对数据的洞察力，为进一步分析提供信息。

由于我对此很陌生，所以我对各种聚类算法的了解还不够，所以我真的不知道从哪里开始。谁能建议一个合适的模型来使用，或者我可以研究的一些模型。

【问题讨论】：

标签： classification cluster-analysis data-mining decision-tree rapidminer

【解决方案1】：

这在我看来不看起来像集群。

相反，我认为您需要一个简单的决策树分类。

它应该已经在 Rapidminer 中可用。

【讨论】：

感谢您的建议。我已经使用规则归纳让它工作了，但我已经查看了决策树，它绝对是我需要的！

【解决方案2】：

您可以使用“生成属性”运算符。

这会从现有属性创建新属性。

创建所有规则会比较烦人，但它们会像

集群：if (((A==0)&&(B==0)&&(C==0)),1,0)

【讨论】：

这就是我开始的地方，但是规则会变得比我给出的示例更复杂，而且手动执行它们已经很烦人了。