【发布时间】:2016-09-11 07:56:09
【问题描述】:
我正在使用 Apriori 算法查找频繁项集。这里我使用最小支持为 2,我得到的输出如下,具有 2 个或更多支持的项集;
[3,5] [1,3] [2,5] [2,3] [2,3,5]
以上所有项目集的支持值都大于最小支持。 但是我很困惑我应该将哪个项目集视为这 5 个项目集中的频繁项目集,另外我也想知道通常我们得到什么作为 Apriori 算法的最终输出,它只是一个最终集还是不止一个集集合的大小?
谢谢
【问题讨论】:
-
您的意思是“您应该将哪个项目集视为
THE MOST频繁出现在其中”? -
是的。最后我应该使用哪个项目集为用户推荐项目?
-
你看过 R 的
arules包吗?来自apriori()函数的规则可以按confidence排序。如果我使用“Apriori”作为推荐器,我会选择具有相似lhs的规则,并从中挑选出具有最高confidence的rhs。你可以阅读 R 对apriorialgo here 的实现 -
谢谢。我认为这很有帮助..
标签: data-mining apriori