【发布时间】:2020-09-28 17:15:18
【问题描述】:
我有一个场景,我想在两个数据帧之间找到不匹配的行。两个数据框将有大约 30 列和一个 id 列,用于唯一标识每条记录/行。所以,我想检查df1 中的一行是否与df2 中的行不同。 df1 是更新的数据框,df2 是以前的版本。
我尝试了一种方法 pd.concat([df1, df2]).drop_duplicates(keep=False) ,但它只是结合了两个数据框。有没有办法做到这一点。非常感谢您的帮助。
dfs 的示例数据如下所示。
iduser_idtypestatus
总共有 39 列可能包含 NULL 值。
谢谢。
附: df2 将始终是 df1 的子集。
【问题讨论】:
-
所以this 的第一个解决方案无法使用,您是否也尝试另一个解决方案?还有什么原因不起作用?是否可以添加示例数据,minimal, complete, and verifiable example 以显示您的问题?
-
@jezrael 如果您按照弓箭手发布的链接,我也会遇到同样的问题。我什至也尝试过这种方法,但它返回了 df1 中的所有行。
-
是的,所以请添加一些示例数据以查看您的问题,仅限please don't post images of code/data (or links to them)
-
而且,顺便说一下,其中可能有包含空值的列。