【问题标题】:Association rules having same support but different confidence values支持度相同但置信度值不同的关联规则
【发布时间】:2020-11-16 15:28:22
【问题描述】:

我正在从我的数据中生成规则,我注意到的一件事是一些重复的规则。这些规则具有相同的支持、提升和计数值,但不同的置信度和覆盖率值。

我最初认为这是由于其中一个产品名称中的空格造成的,但我在挖掘规则之前已经修剪和清理了产品信息。

#GENERATE RULES
rules1 <- apriori(transactions,
                 parameter = list(
                   sup = supportLevels[3],
                   conf = confidenceLevels[9],
                   minlen = 2,
                   target = "rules"
                 )
)

# VIEW THE ASSOCIATION RULES
inspect(sort(rules1, 
             by = "lift", # sort by strongests to weakest rules
             decreasing = TRUE))

您可以在下面看到前两条规则,它们是重复的/对称的,但具有不同的置信度值。

很遗憾,我无法共享我的数据集,因为它是专有的,并且我无法使用 Arules 中的 Groceries 数据集进行复制。

有没有人知道为什么我可以获得不同的信心,但对这些规则的支持和提升是相同的?

【问题讨论】:

    标签: r arules


    【解决方案1】:

    这直接来自两个规则的度量的定义

    X => Y
    Y => X
    

    它们都是由 X 和 Y 的并集给出的相同频繁项集创建的。

    • 支持度是在generating频繁项集上计算的,所以supp(X =&gt; Y) = supp(Y =&gt; X) = supp(X and Y)
    • 电梯是对称的,所以lift(X =&gt; Y) = lift(X =&gt; Y)
    • 信心是不对称的,取决于左侧的支持。所以如果supp(X)supp(Y) 不同,那么conf(X =&gt; Y) 将与conf(Y =&gt; X) 不同。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2012-10-19
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-01-14
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多