【问题标题】:What should we consider as the final output of the Apriori Algorithm我们应该考虑什么作为 Apriori 算法的最终输出
【发布时间】:2016-09-11 07:56:09
【问题描述】:

我正在使用 Apriori 算法查找频繁项集。这里我使用最小支持为 2,我得到的输出如下,具有 2 个或更多支持的项集;

[3,5] [1,3] [2,5] [2,3] [2,3,5]

以上所有项目集的支持值都大于最小支持。 但是我很困惑我应该将哪个项目集视为这 5 个项目集中的频繁项目集,另外我也想知道通常我们得到什么作为 Apriori 算法的最终输出,它只是一个最终集还是不止一个集集合的大小

谢谢

【问题讨论】:

  • 您的意思是“您应该将哪个项目集视为THE MOST 频繁出现在其中”?
  • 是的。最后我应该使用哪个项目集为用户推荐项目?
  • 你看过 R 的arules 包吗?来自apriori() 函数的规则可以按confidence 排序。如果我使用“Apriori”作为推荐器,我会选择具有相似 lhs 的规则,并从中挑选出具有最高 confidencerhs。你可以阅读 R 对 apriori algo here 的实现
  • 谢谢。我认为这很有帮助..

标签: data-mining apriori


【解决方案1】:

您的结果不完整。它缺少所有频繁的 1 项集。

另外,你应该保持频率。

您总是需要频繁项集,但通常您会希望从中派生关联规则

【讨论】:

    猜你喜欢
    • 2017-04-26
    • 2014-03-10
    • 2020-02-18
    • 2012-02-02
    • 2016-10-13
    • 1970-01-01
    • 1970-01-01
    • 2022-01-24
    • 1970-01-01
    相关资源
    最近更新 更多