【发布时间】:2019-06-16 08:00:40
【问题描述】:
假设我有两个数据框:
df1:
A
0 a
1 b
df2:
A
0 a
1 c
我希望结果是两个框架的 并集,其中 额外的列 显示该行所属的源数据框架。如果出现重复,应删除重复项,并且相应的额外列应显示两个来源:
A B
0 a df1, df2
1 b df1
2 c df2
我可以得到没有重复的连接数据帧(df3)如下:
import pandas as pd
df3=pd.concat([df1,df2],ignore_index=True).drop_duplicates().reset_index(drop=True)
我想不出/找到一种方法来控制哪些元素去哪里。如何添加额外的列?
非常感谢您提供的任何提示。
【问题讨论】:
标签: python pandas dataframe merge concatenation