【发布时间】:2019-11-18 15:31:09
【问题描述】:
我有一个数据框,其中在行上采购了独特的项目,在列上采购了相应的来源(基本上这是我从原始数据中“dcast”的数据)
现在是这个样子
DF
)
现在基于这些 dacasted 数据,我必须创建一个表来检查来自此类来源的重复项
【问题讨论】:
标签: r dplyr tidyverse tidyr dcast
我有一个数据框,其中在行上采购了独特的项目,在列上采购了相应的来源(基本上这是我从原始数据中“dcast”的数据)
现在是这个样子
DF
)
现在基于这些 dacasted 数据,我必须创建一个表来检查来自此类来源的重复项
【问题讨论】:
标签: r dplyr tidyverse tidyr dcast
您可以通过以下代码获取:
m <- as.matrix(DF[-1])
z <- t(m)%*%m
diag(z) <- NA
给出:
> z
Source1 Source2 Source3 Source4
Source1 NA 2 0 1
Source2 2 NA 2 0
Source3 0 2 NA 0
Source4 1 0 0 NA
【讨论】: