【发布时间】:2023-03-04 13:58:02
【问题描述】:
我有两个数据框对应两个不同的事件。
Event A :
Person_Id | Event_A_Date (yyyy-mm-dd) | A_Reason (The suffix denotes whether X belongs to event A or B)
1 2020-04-01 X_A
2 2020-03-29 X_A
1 2020-04-02 Y_A
3 2020-03-28 Z_A
2 2020-04-01 Z_A
Event B :
Person Id | Event_B_Date(yyyy-mm-dd) | B_Reason
1 2020-04-03 Z_B
2 2020-03-30 Y_B
3 2020-03-29 X_B
只有 Person_Id 列对两个 DF 是通用的。
现在,对于每个人 ID,我想要按照事件发生的顺序(按日期)列出与事件 A 或 B 相对应的原因。
也就是说,我想要的输出是:
Person_Id | Event_sequence
1 [X_A, Y_A, Z_B]
2 [X_A, Y_B, Z_A]
3 [Z_A, X_B]
我正在努力使用 Python 获取此输出,因为 Person_ID 是两个数据帧中唯一的公共列。
有人可以帮我用 python 得到这个输出吗?
【问题讨论】:
标签: python pandas datetime group-by time-series