【发布时间】:2021-11-20 15:20:54
【问题描述】:
我有一个看起来像这样的 df:
df.set_index(['pid','vid]).sort_values(by = 'time')
之前:
pid time
id vid
id1 vis_id1 pid1 t_0
vis_id1 pid2 t_1
vis_id1 pid1 t_2
vis_id1 pid2 t_3
vis_id1 pid1 t_4
id2 vis_id2 pid1 t_3
vis_id2 pid2 t_4
vis_id2 pid2 t_5
vis_id2 pid2 t_6
vis_id2 pid2 t_7
我想折叠所有pid,这样对于每个id,我们都有以下df
pid
id vid
id1 vis_id1 pid1, pid2, pid1, pid2, pid1
id2 vis_id2 pid1, pid2, pid2, pid2, pid2
我尝试过先转置数据,然后再应用[steps].apply(lambda x: ', '.join(x[x.notnull()]), axis = 1),但如果我能同时避免转置,那将为我节省大量计算能力
【问题讨论】:
-
嗨!谢谢,得到了另一个项目,我很快就会回到这个项目。谢谢!
标签: python pandas dataframe data-analysis multi-index