【发布时间】:2012-07-16 02:58:23
【问题描述】:
我在mahout中学习fpgrowth,我发现了出生频繁项集的功能,但是如何使用mahout与频繁项集形成规则?它还没有在 mahout 中实现吗?
【问题讨论】:
标签: data-mining mahout
我在mahout中学习fpgrowth,我发现了出生频繁项集的功能,但是如何使用mahout与频繁项集形成规则?它还没有在 mahout 中实现吗?
【问题讨论】:
标签: data-mining mahout
从频繁模式计算规则相当容易,并且可能不会从并行性和分布式中受益很多。毕竟,预计您从数据中获得的频繁模式数量要少得多。
因此,在 Mahout 之外执行此操作可能会快得多,具体取决于您拥有的频繁模式的数量。
【讨论】:
Mahout 并非专门用于模式挖掘。
您可以查看SPMF软件:http://www.philippe-fournier-viger.com/spmf/index.php(我是作者)。
它拥有超过 45 种与频繁项集和关联规则挖掘相关的算法的 Java 源代码。
它包括一些经典算法的算法,如 FPGrowth。但它还提供了一些其他数据挖掘工具中找不到的专用算法,例如挖掘稀有项集、可擦除项集、高效用项集、来自不确定数据的项集等。
例如,除了“经典”关联规则之外,您还可以尝试许多不同类型的关联规则,例如:封闭关联规则、关联规则的信息性和通用基础、顺序规则等。
它在 GPL 下获得许可,并且有一个简单的 GUI 界面用于一些最流行的算法,如果您有任何问题,您可以在论坛中发布,我会尽力回答您。
【讨论】: