【发布时间】:2017-09-06 22:15:12
【问题描述】:
给定下面的 FP-tree:
对于 E 项:
条件模式基是:
{B:1, A:1} {B:1, A:1, C:1}
从这个条件FP-tree得到
{B:2, A:2}
但是如何从中获得频繁模式呢?然后是闭合频繁集和最大频繁集?
【问题讨论】:
标签: pattern-matching classification data-mining apriori
给定下面的 FP-tree:
对于 E 项:
条件模式基是:
{B:1, A:1} {B:1, A:1, C:1}
从这个条件FP-tree得到
{B:2, A:2}
但是如何从中获得频繁模式呢?然后是闭合频繁集和最大频繁集?
【问题讨论】:
标签: pattern-matching classification data-mining apriori
“获得频繁模式”是什么意思?
在此示例中,{B, A} 是 2 个项目集,常见于 E。这意味着 A 和 B 经常与 E 一起出现。每个项目的数字'2',代表支持,表示每个项目(A和B)见过'2' 时间与项目 'E'
【讨论】:
这取决于指定的最低支持。 假设最小支持度为 2:
对于项目 E..
您的条件基础: {B:1, A:1} {B:1, A:1, C:1}
您的 F 列表: {B:2, A:2}
因此频率模式: E:2,EB:2,EA:2 (这通过对每个集合中项目的频率求和并检查它是否 >= 到最小支持来检查。
然后采用以下定义:
项集是封闭的:没有一个直接超集具有与项集相同的支持
一个项集是最大频繁的:它的直接超集都不是频繁的
您需要计算其他条件基并检查超集是否符合上述定义。例如。 {B, A, C} 是 {B, A} 的超集。
【讨论】: