支持度相同但置信度值不同的关联规则答案

【问题标题】：Association rules having same support but different confidence values支持度相同但置信度值不同的关联规则
【发布时间】：2020-11-16 15:28:22
【问题描述】：

我正在从我的数据中生成规则，我注意到的一件事是一些重复的规则。这些规则具有相同的支持、提升和计数值，但不同的置信度和覆盖率值。

我最初认为这是由于其中一个产品名称中的空格造成的，但我在挖掘规则之前已经修剪和清理了产品信息。

#GENERATE RULES
rules1 <- apriori(transactions,
                 parameter = list(
                   sup = supportLevels[3],
                   conf = confidenceLevels[9],
                   minlen = 2,
                   target = "rules"
                 )
)

# VIEW THE ASSOCIATION RULES
inspect(sort(rules1, 
             by = "lift", # sort by strongests to weakest rules
             decreasing = TRUE))

您可以在下面看到前两条规则，它们是重复的/对称的，但具有不同的置信度值。

很遗憾，我无法共享我的数据集，因为它是专有的，并且我无法使用 Arules 中的 Groceries 数据集进行复制。

有没有人知道为什么我可以获得不同的信心，但对这些规则的支持和提升是相同的？

【问题讨论】：

标签： r arules

【解决方案1】：

这直接来自两个规则的度量的定义

X => Y
Y => X

它们都是由 X 和 Y 的并集给出的相同频繁项集创建的。

支持度是在generating频繁项集上计算的，所以supp(X => Y) = supp(Y => X) = supp(X and Y)
电梯是对称的，所以lift(X => Y) = lift(X => Y)
信心是不对称的，取决于左侧的支持。所以如果supp(X) 与supp(Y) 不同，那么conf(X => Y) 将与conf(Y => X) 不同。

【讨论】：