【发布时间】:2017-06-16 08:55:53
【问题描述】:
我想根据两个(或更多)变量的唯一组合来计算 id 变量。考虑下面的简单示例:
# Example dataframe
mydf <- data.frame(var1 = LETTERS[c(1, 2, 1)], var2 = LETTERS[c(2, 1, 3)])
mydf
# var1 var2
# A B
# B A
# A C
这里,第 1 行和第 2 行应该具有相同的 id,因为 AB 和 BA 表示相同元素的组合。但是,第 3 行有一个不同的 id,因为 AC 组合只出现一次。
# Desired output
cbind(mydf, cid = c(1, 1, 2))
# var1 var2 cid
# A B 1
# B A 1
# A C 2
有什么建议吗?
【问题讨论】:
标签: r dataframe combinations permutation