【问题标题】:Boolean attributes in WekaWeka 中的布尔属性
【发布时间】:2013-09-22 06:18:16
【问题描述】:

是否可以在 WEKA 中实现布尔属性?

我想实施购物篮分析,为此我需要这样的表格

Product_A Prod_B
Yes       No
No        Yes
Yes       Yes

等等。

对于Nofalse,我可以使用?,它代表WEKA 中的空值:

Product_A Prod_B
Yes       ?
?         Yes
Yes       Yes

但现在我得到了频率。项目集和规则,例如:

Product_A=Yes, Prod_B=Yes

但我只想拥有

Product_A, Prod_B.

你知道我的意思吗?

我找到了一个关于创建 ARFF 文件的guide,但没有任何布尔数据类型.. 但是拥有这样的数据类型会很有用,还是我想错了?

【问题讨论】:

    标签: data-mining weka arff


    【解决方案1】:

    只需使用带有 0 和 1 的数字属性来表示 false 和 true。 ML 算法通常不关心布尔值,并且无论如何都会将它们视为数字。

    【讨论】:

      【解决方案2】:

      使用ft 作为标称值。这在supermarket.arff 示例文件中使用,并且与Java API 兼容。

      我用这段 Java 代码创建了这样一个“布尔”属性:

      FastVector tempBooleanValues = new FastVector();
      tempBooleanValues.addElement("f");
      tempBooleanValues.addElement("t");
      tempAttributes.addElement(new Attribute("attribute_1", tempBooleanValues));
      

      在arff文件中是这样的:

      @attribute attribute_1 {f,t}
      ...
      transaction_1,f
      transaction_2,t
      

      【讨论】:

        【解决方案3】:

        有关示例,请参阅 Weka supermarket.arff 文件。

        如果你想使用稀疏格式,那么 IIRC 会有点棘手;因为默认情况下缺失值被替换为它们的模式 - 届时将是Yes。但我相信 Weka 的最新版本(不是书本版本)在这方面有改进。

        【讨论】:

          猜你喜欢
          • 2011-12-26
          • 2010-10-16
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 2013-05-27
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          相关资源
          最近更新 更多