【发布时间】:2016-05-04 03:40:46
【问题描述】:
我有两个数据框 df1 和 df2,有人告诉我它们共享一些行。也就是说,对于某些索引, (i,j)_n df1.loc[i] == df2.loc[j] 完全正确。我想找到这个信件。
这是一个棘手的问题。我不想“手动”查询每一行的每一列,所以我一直在寻找更干净的东西。
这是我拥有的最好的,但速度不快。我希望一些大师能指出我正确的方向。
matching_idx=[]
for ix in df1.index:
match =df1.loc[ix:ix].to_dict(orient='list')
matching_idx.append( df2.isin(match).all(axis=1) )
摆脱 for 循环会很好,但我不确定这是否可能。
【问题讨论】:
标签: python-2.7 pandas