【发布时间】:2019-06-04 07:06:15
【问题描述】:
您好,我想合并一个表中的 2 列,并在一个新表中创建一个唯一值列表。
示例: 数据集 = DT
Source Destination
A B
A C
B C
新表(DT_New)
Unique names
A
B
C
我已经尝试使用以下代码:
DT_New <- unlist(DT)
DT_New<- data.table(DT_New)
DT_New = DT_New[!duplicated(DT_New), ]
当我使用此代码时,它会返回以下结果:
新表(DT_New)
Unique names
A
B
B
C
上面的代码似乎可以将“B”与列 Source 和列目标区分开来。如何避免此问题并获得具有唯一值的表?
Unique names
A
B
C
【问题讨论】:
-
试试
unique(unlist(df))。 -
用你的代码我得到了想要的结果。
-
我也得到了预期的输出。见这里:
library(data.table); DT <- data.frame(Source= c("A", "A", "B"), Destination= c("B", "C", "C")); DT_New <- unlist(DT); DT_New<- data.table(DT_New); DT_New = DT_New[!duplicated(DT_New), ]; DT_New给A B C
标签: r duplicates data.table