【发布时间】:2016-07-10 06:30:09
【问题描述】:
假设我有两列:
A B
1 1
2 2
3 4
4 4
5 4
6 6
有没有办法计算相似度的百分比,所以在上面的例子中我们发现 A 列和 B 列有 67% 相同。
【问题讨论】:
-
你需要
sum(df1$A %in% df1$B)/nrow(df1) -
4/6 = 66.6% 而不是 68% - 除非我错过了什么?
-
是的,你是对的,我的错误。
-
您的比较是逐行比较,还是只是值必须出现在任一列中?
-
应该逐行比较。