【问题标题】:how to form rules with frequent itemsets using mahout如何使用 mahout 形成具有频繁项集的规则
【发布时间】:2012-07-16 02:58:23
【问题描述】:

我在mahout中学习fpgrowth,我发现了出生频繁项集的功能,但是如何使用mahout与频繁项集形成规则?它还没有在 mahout 中实现吗?

【问题讨论】:

    标签: data-mining mahout


    【解决方案1】:

    从频繁模式计算规则相当容易,并且可能不会从并行性和分布式中受益很多。毕竟,预计您从数据中获得的频繁模式数量要少得多。

    因此,在 Mahout 之外执行此操作可能会快得多,具体取决于您拥有的频繁模式的数量。

    【讨论】:

      【解决方案2】:

      Mahout 并非专门用于模式挖掘。

      您可以查看SPMF软件:http://www.philippe-fournier-viger.com/spmf/index.php(我是作者)。

      它拥有超过 45 种与频繁项集和关联规则挖掘相关的算法的 Java 源代码。

      它包括一些经典算法的算法,如 FPGrowth。但它还提供了一些其他数据挖掘工具中找不到的专用算法,例如挖掘稀有项集、可擦除项集、高效用项集、来自不确定数据的项集等。

      例如,除了“经典”关联规则之外,您还可以尝试许多不同类型的关联规则,例如:封闭关联规则、关联规则的信息性和通用基础、顺序规则等。

      它在 GPL 下获得许可,并且有一个简单的 GUI 界面用于一些最流行的算法,如果您有任何问题,您可以在论坛中发布,我会尽力回答您。

      【讨论】:

      • 在 mahout 中,只有他们所谓的“并行 FP-Growth”来查找项集。找到项集后,没有生成关联规则的算法。如果你想用 Mahout 找到规则,你需要自己实现它。此外,请注意他们所谓的“Parallel FPGrowth”与原始 FPGrowth 略有不同。 Mahout 中的版本挖掘 top-k 项集,而不是挖掘具有 minsup 阈值的项集。
      猜你喜欢
      • 2011-10-26
      • 2012-12-20
      • 2018-03-25
      • 2018-11-06
      • 2011-03-04
      • 2016-09-18
      • 1970-01-01
      • 2011-04-17
      • 1970-01-01
      相关资源
      最近更新 更多