【发布时间】:2021-11-03 16:46:05
【问题描述】:
我想创建一个子集,其中删除了具有 3 个或更多相同列的数据,但保留了原始数据。我有 4 列 ['col1', 'col2', 'col3', 'col4'],并写下一段代码:
df1 = data_between_all.drop_duplicates(['col1', 'col2', 'col3']).copy()
df2 = data_between_all.drop_duplicates(['col1', 'col3', 'col4']).copy()
df3 = data_between_all.drop_duplicates(['col1', 'col2', 'col4']).copy()
df4 = data_between_all.drop_duplicates(['col2', 'col3', 'col4']).copy()
data_without_duplicates = df1.append([df2, df3, df4]).drop_duplicates()
有没有最复杂的方法来做到这一点?
【问题讨论】:
标签: python pandas dataframe filtering