【发布时间】:2018-04-05 11:06:18
【问题描述】:
我有 2 个数据框:
> dput(DF1)
structure(c("a", "b", "c", "d", "e", "f", "g"), .Dim = c(1L,
7L), .Dimnames = list("1", c("seq1", "seq2", "seq3", "seq4",
"seq5", "seq6", "seq7")))
> dput(DF2)
structure(list(seq1 = c("a", "a", "a", "a", "a"), seq2 = c("b",
"d", "d", "d", "b"), seq3 = c("c", "c", "c", "c", "c"), seq4 = c("e",
"e", "d", "d", "d"), seq5 = c("f", "f", "f", "g", "e"), seq6 = c("g",
"g", "g", "g", "g"), seq7 = c("g", "g", "g", "g", "g"), UserId = c("1",
"2", "3", "4", "5")), .Names = c("seq1", "seq2", "seq3", "seq4",
"seq5", "seq6", "seq7", "UserId"), row.names = c(NA, -5L), class = "data.frame")
这些是我想要比较的上述两个数据集,例如 DF2 中的 User1 偏离了 e(而不是 goind 到 d,他去了 e)。 DF1 是我正确定义的序列。 所以最后我需要按照以下要求制作一个数据框:
> dput(required_dataframe)
structure(list(UserID = c("1", "2", "3", "4", "5"), Deviation = c("e",
"d", "d", "d", "g"), Actual_sequence = c("d", "b", "b", "b",
"f")), .Names = c("UserID", "Deviation", "Actual_sequence"), row.names = c(NA,
-5L), class = "data.frame")
对于 user1 偏离点 e 的实例(它应该已经到 d)。因此,对于所有用户,我需要计算偏差点以及实际序列。 DF1 ,DF2 的附件图片以及所需的数据框请找到。
【问题讨论】: