【发布时间】:2019-05-03 01:45:54
【问题描述】:
我有两个需要比较ticket_id 列的数据框。如果有匹配项,我需要将一列添加到来自第二个数据帧的列的第一个数据帧。如果第一个数据帧和第二个数据帧不匹配,则意味着第二个数据帧中有一个新行需要添加到第一个数据帧。
我尝试过使用 if 语句,但未能成功地比较它们。
df_A(当周服务台工单报告)
ticket_id category submitted closed status
1 critical 4/20/19 5/1/19 closed
2 low 4/23/19 5/2/19 closed
3 medium 4/26/19 open
4 low 5/1/19 open
df_B(前一周帮助台工单报告)
ticket_id category submitted closed status
1 critical 4/20/19 open
2 low 4/23/19 open
3 medium 4/26/19 open
所以我基本上想基于 df_A 创建一个新的数据框,但获取该票证 ID 的前一周状态并将其作为最后一列添加到新数据框。如果从前一周到新的一周出现了一张新票(即ticket_id = 4),那么它应该被附加并且应该有一个NA或空白状态(并不重要)。
预期的 df_A
ticket_id category submitted closed status previous_week_status
1 critical 4/20/19 5/1/19 closed open
2 low 4/23/19 5/2/19 closed open
3 medium 4/26/19 open open
4 low 5/1/19 open NA
【问题讨论】:
-
ticket_id真的是 ID 吗?即,您的每个数据框中的每个票证 ID 是否只有一行? -
这是一个 ID,我只是使用 1-4 来简化它,但对于给定的票,它实际上看起来像“IR2382”。它是每一行的主键。
-
Pandas Merging 101的可能重复