【发布时间】:2015-11-10 13:57:12
【问题描述】:
使用包 arules 中的 apriori 算法很容易:
import rpy2.interactive as r
arules = r.packages.importr("arules")
from rpy2.robjects.vectors import ListVector
od = OrderedDict()
od["supp"] = 0.0005
od["conf"] = 0.7
od["target"] = 'rules'
result = ListVector(od)
my_rules = arules.apriori(dataset, parameter=result)
但是,apriori 子集在子集参数中使用了不同的格式:
rules.sub <- subset(rules, subset = rhs %in% "marital-status=Never-married" & lift > 2)
rpy2 可以使用这个子集函数吗?
【问题讨论】:
-
如果示例是独立的,则更容易(例如这里的对象
rules究竟是由什么组成的)。 R 的subset工作正常,但您可能会发现dplyr的接口很有趣:rpy2.readthedocs.org/en/version_2.7.x/…(使用filter而不是subset) -
@lgautier 我相信 arules 包会覆盖 R 子集中的子集,因此使用该语法。我会看到 dplyr 的过滤器。谢谢。
标签: python r rpy2 apriori arules