【问题标题】:Designing a clustering process using RapidMiner使用 RapidMiner 设计聚类过程
【发布时间】:2012-10-14 09:20:13
【问题描述】:

我在机器学习或集群方面没有太多经验,所以我对如何解决这个问题有点茫然。我感兴趣的数据由 4 列组成,其中一列只是一个 id。其他 3 个包含数值数据,值 >= 0。我需要的聚类实际上非常简单,我可以手动完成,但稍后会变得不太清楚,所以我想从正确的过程开始。我需要 6 个集群,它们取决于 3 列(称为 A、B 和 C),如下所示:

A    B    C        Cluster
---- ---- -------- -------
0    0    0        0
0    0    >0       1
0    >0   <=B      2
0    >0   >B       3
>0   any  <=(A+B)  4
>0   any  >(A+B)   5

在这个阶段,这些集群将提供对数据的洞察力,为进一步分析提供信息。

由于我对此很陌生,所以我对各种聚类算法的了解还不够,所以我真的不知道从哪里开始。谁能建议一个合适的模型来使用,或者我可以研究的一些模型。

【问题讨论】:

    标签: classification cluster-analysis data-mining decision-tree rapidminer


    【解决方案1】:

    这在我看来看起来像集群

    相反,我认为您需要一个简单的决策树分类

    它应该已经在 Rapidminer 中可用。

    【讨论】:

    • 感谢您的建议。我已经使用规则归纳让它工作了,但我已经查看了决策树,它绝对是我需要的!
    【解决方案2】:

    您可以使用“生成属性”运算符。

    这会从现有属性创建新属性。

    创建所有规则会比较烦人,但它们会像

    集群:if (((A==0)&&(B==0)&&(C==0)),1,0)

    【讨论】:

    • 这就是我开始的地方,但是规则会变得比我给出的示例更复杂,而且手动执行它们已经很烦人了。
    猜你喜欢
    • 1970-01-01
    • 2015-07-17
    • 1970-01-01
    • 2013-06-04
    • 1970-01-01
    • 2014-11-06
    • 2015-01-30
    • 2013-07-03
    • 1970-01-01
    相关资源
    最近更新 更多