【发布时间】:2017-05-05 21:09:14
【问题描述】:
我有一个这样的 df:
ID Cluster Product
1 4 'b'
1 4 'f'
1 4 'w'
2 7 'u'
2 7 'b'
3 5 'h'
3 5 'f'
3 5 'm'
3 5 'd'
4 7 's'
4 7 'b'
4 7 'g'
其中 ID 是作为该 df 源的另一个 df 的主键和唯一键。 Cluster 不是 key,不同的 ID 通常有相同的 Cluster value;无论如何,这是我必须继续进行的信息。
我想要得到的是这个数据框:
ID Cluster Product_List_by_ID
1 4 ['b','f','w']
2 7 ['u','b']
3 5 ['h','f','m','d']
4 7 ['s','b','g']
如果这是不可能的,那么像这样的字典也可以:
d = {ID:[1,2,3,4], Cluster:[4,7,5,7],
Product_List_by_ID:[['b','f','w'],['u','b'],['h','f','m','d'],['s','b','g']]}
我尝试了很多方法都没有成功.. 似乎无法将列表作为熊猫数据框值插入.. 无论如何,我认为以某种棘手的方式实现目标应该不难.. 对不起,如果我发疯了,但我是编码新手
有什么建议吗?!谢谢
【问题讨论】:
标签: python pandas dataframe group-by pandas-groupby