【发布时间】:2021-11-04 15:18:41
【问题描述】:
所以基本上我有 2 个具有以下结构的数据框
PATH CUID NAME Author Updated
1 1 Test Test 01/01/2021
2 2 Test1 Test 01/01/2021
PATH CUID NAME Author Updated
1 1 Test Test 2 01/02/2021
3 3 Test2 Test 2 01/02/2021
是否可以使用 3 个键列进行合并?我知道使用 2 列进行合并的代码,但不确定是否可以添加第 3 列。
我正在进行外部连接,以便所有值都存在,如果两个数据帧上没有匹配项,则只有 Author(x 或 y) 和 Updated(x 或 y) 将被清空。
示例输出为:
PATH CUID NAME Author_x Updated_x Author_y Updated_y
1 1 Test Test 01/01/2021 Test 2 01/02/2021
2 2 Test1 Test 01/01/2021
3 3 Test2 Test 2 01/02/2021
【问题讨论】:
-
df3 = df1.merge(df2, on=['PATH', 'CUID', 'NAME'], how='outer')例如。