【发布时间】:2020-01-09 04:50:10
【问题描述】:
有没有办法在 python 中扫描数据框以创建一个按特定列分组的新数据框,删除重复项,同时将不相似的条目保存到列表中?
如果我有一个看起来像这样的数据框...
Genre Rating CustomRating
Thriller 5 5
Thriller 5 5
Comedy 9 9
Action 3 6
Action 2 7
我需要它变成这样的东西......
Genre Rating CustomRating
Thriller 5 5
Comedy 9 9
Action 3, 2 6, 7
进度更新
@ignoring_gravity 建议 df.drop_duplicates().groupby('Genre', sort=False).agg(list) 的工作效果很好,但是有没有办法将项目返回为字符串或 int 而不是列表?
【问题讨论】:
-
您能否举例说明在
Thriller, 5, 6附加行的情况下的预期输出?目前尚不清楚什么是“重复” -
@ALollz 在这种情况下该行看起来...
Thriller55 ,6其中Raiting得分相同,但CustomRating注意到两个不同的得分.