【发布时间】:2015-07-27 20:05:30
【问题描述】:
我有一个数据框,其中包含某个所有者按时间顺序购买的宠物。我想通过确定一种宠物跟随另一种宠物的频率来预测主人接下来可能购买哪种宠物(例如,购买狗,然后购买猫)。如何识别每个排列的计数?
df <- data.frame(
id = c("AZ001", "AZ002", "AZ003", "AZ004", "AZ005"),
p1 = c("Dog", "Cat", "Fish", "Dog", "Cat"),
p2 = c("Dog", "Fish", "Dog", "Cat", "Cat"),
p3 = c("Fish", "Cat", "Dog", "Fish", "Fish"),
p4 = c(NA, "Cat", NA, "Fish", "Dog"),
p5 = c(NA, NA, NA, "Cat", "Dog"))
基本上,我想要一张关于一只宠物引向另一只宠物的次数的表格,即:
- 狗 - 鱼 (1)
- 狗 - 猫 (1)
- 狗 - 狗 (3)
【问题讨论】:
-
@MrFlick 我认为这是长度为 2 的序列列表(第一行是 Dog+Dog,然后是 Dog+Fish),但不确定。
-
@MrFlick 在编辑中添加所需的输出。
标签: r