【发布时间】:2022-01-21 17:58:15
【问题描述】:
我有一个巨大的数据集,当这种关系在意义上理解 ID1、ID2 或 ID2、ID1(在不同列中)时,变量中包含重复信息,变量中的值也可以从不同的 ID 关系中重复。我想使用反向 ID 顺序删除相同的信息,如下所示:
ID1 ID2 value
BHFUD13XG KLSIENAL1 0.3475
GLADKK123 FBNAFLEL2 0.2956
KLSIENAL1 BHFUD13XG 0.3475
FBNAFLEL2 GLADKK123 0.2956
DGFEORM23 SHDKG14NV 0.3475
SHDKG14NV DGFEORM23 0.3475
清洁
ID1 ID2 value
BHFUD13XG KLSIENAL1 0.3475
GLADKK123 FBNAFLEL2 0.2956
DGFEORM23 SHDKG14NV 0.3475
感谢您的帮助!
【问题讨论】:
-
不要用图片发布您的数据。
-
我们无法从图像中复制/粘贴数据。请保留有用的编辑,使用纯文本格式的数据。
-
这在我看来可能有一个数据准备步骤,在此之前可能会以不同方式和更有效地完成。 ?