【发布时间】:2020-11-16 15:28:22
【问题描述】:
我正在从我的数据中生成规则,我注意到的一件事是一些重复的规则。这些规则具有相同的支持、提升和计数值,但不同的置信度和覆盖率值。
我最初认为这是由于其中一个产品名称中的空格造成的,但我在挖掘规则之前已经修剪和清理了产品信息。
#GENERATE RULES
rules1 <- apriori(transactions,
parameter = list(
sup = supportLevels[3],
conf = confidenceLevels[9],
minlen = 2,
target = "rules"
)
)
# VIEW THE ASSOCIATION RULES
inspect(sort(rules1,
by = "lift", # sort by strongests to weakest rules
decreasing = TRUE))
您可以在下面看到前两条规则,它们是重复的/对称的,但具有不同的置信度值。
很遗憾,我无法共享我的数据集,因为它是专有的,并且我无法使用 Arules 中的 Groceries 数据集进行复制。
有没有人知道为什么我可以获得不同的信心,但对这些规则的支持和提升是相同的?
【问题讨论】: