我们应该考虑什么作为 Apriori 算法的最终输出答案

【问题标题】：What should we consider as the final output of the Apriori Algorithm我们应该考虑什么作为 Apriori 算法的最终输出
【发布时间】：2016-09-11 07:56:09
【问题描述】：

我正在使用 Apriori 算法查找频繁项集。这里我使用最小支持为 2，我得到的输出如下，具有 2 个或更多支持的项集；

[3,5] [1,3] [2,5] [2,3] [2,3,5]

以上所有项目集的支持值都大于最小支持。但是我很困惑我应该将哪个项目集视为这 5 个项目集中的频繁项目集，另外我也想知道通常我们得到什么作为 Apriori 算法的最终输出，它只是一个最终集还是不止一个集集合的大小？

谢谢

【问题讨论】：

您的意思是“您应该将哪个项目集视为THE MOST 频繁出现在其中”？
是的。最后我应该使用哪个项目集为用户推荐项目？
你看过 R 的arules 包吗？来自apriori() 函数的规则可以按confidence 排序。如果我使用“Apriori”作为推荐器，我会选择具有相似 lhs 的规则，并从中挑选出具有最高 confidence 的 rhs。你可以阅读 R 对 apriori algo here 的实现
谢谢。我认为这很有帮助..

【解决方案1】：

您的结果不完整。它缺少所有频繁的 1 项集。

另外，你应该保持频率。

您总是需要频繁项集，但通常您会希望从中派生关联规则。

【讨论】：