【发布时间】:2022-01-10 21:53:26
【问题描述】:
我有一本字典,其中包含项集的键和它们的计数值。我想计算项目集在数据框中出现的次数(作为完全匹配)。数据框有 ~10k 行
第一个项目集的字典(dict_of_items):
{'apple','banana','pear'}: 0,
{'banana', 'orange', 'squash'}: 0
第二个项目集的数据框(df):
Index | basket
1 | ['apple','banana',pear']
2 | ['banana']
3 | ['banana', 'orange','squash']
4 | ['apple','banana',pear']
...
期望的输出(字典的值是实际计数):
{'apple','banana','pear'}: 2,
{'banana', 'orange', 'squash'}: 1
我已经尝试过和.iterrows(),但值仍然为0,例如:
for item in dict_of_items:
if item in df['basket']:
dict_of_item[item] += 1
【问题讨论】:
标签: python pandas dictionary