【发布时间】:2020-05-08 05:50:39
【问题描述】:
我有一个如下所示的多个数据框。
df1 = pd.DataFrame({'Col1':["aaa","ddd","ggg"],'Col2':["bbb","eee","hhh"],'Col3':"ccc","fff","iii"]})
df2= pd.DataFrame({'Col1':["aaa","zzz","qqq"],'Col2':["bbb","xxx","eee"],'Col3':["ccc", yyy","www"]})
df3= pd.DataFrame({'Col1':"rrr","zzz","qqq","ppp"],'Col2':"ttt","xxx","eee","ttt"],'Col3':"yyy","yyy","www","qqq"]})
数据框有 3 列,有时它们的行在数据框之间重叠。 (例如 df1 和 df2 与 "aaa, bbb, ccc" 具有相同的行)。
我想知道数据帧之间的行是如何重叠的,并希望得到如下所示的输出。
在此输出中,如果在数据帧中检测到相同的行,则输出将为 1,否则为 0。有人知道如何进行此输出吗?
在实际数据中,我有大约 100 个数据帧。我首先尝试使用 pd.merge 但无法将其应用于 100 个数据帧...
非常感谢您的帮助。
【问题讨论】:
标签: python pandas merge overlap