【发布时间】:2019-08-20 14:40:36
【问题描述】:
我有一个 Pandas Df-
A=
[period store item
1 32 'A'
1 34 'A'
1 32 'B'
1 34 'B'
2 42 'X'
2 44 'X'
2 42 'Y'
2 44 'Y']
我需要实现这样的东西: 如果某个项目与该特定时期的任何其他项目具有相同的商店集,则这些项目是重复的。 所以在这种情况下,A 和 B 是重复的,因为它们在各自的时期拥有相同的商店。
我已尝试使用以下方法将其转换为嵌套字典:
dicta = {p: g.groupby('items')['store'].apply(tuple).to_dict()
for p, g in mkt.groupby('period')}
返回给我这样的字典:
dicta = {1: {'A': (32, 34),'B': (32, 34)}, 2: {'X': (42, 44),'Y': (42, 44)}}
... 所以最后我想要一本这样的字典。
{1:(A,B),2:(X,Y)} 虽然,我无法找到如何找到重复项目的任何逻辑。 有没有其他方法可以找到那些重复的项目
【问题讨论】:
标签: python pandas python-2.7 dataframe