【问题标题】:Pandas: repeated with time difference condition & code [closed]熊猫:重复时差条件和代码[关闭]
【发布时间】:2021-04-20 01:10:07
【问题描述】:

Pandas:请为同一客户找出重复的问题 注意:如果仅在 30 天内使用相同的代码出现问题,则考虑重复

【问题讨论】:

标签: python pandas dataframe duplicates iteration


【解决方案1】:

让我们尝试按客户 ID 和问题代码进行分组,并找出每个组内日期的连续差异。将时间差转换为天数,检查得到的绝对值是否小于等于 30。

但是,请认真注意上面发布的 cmets

df['Date']=pd.to_datetime(df['Date'])# Coerce date to datetime

df[abs(df.groupby(['CT_ID','Problem_code'])['Date'].diff().dt.days).le(30)]


    CT_ID     Problem_code                Date
3   XO1       code_1                  2021-01-03 11:35:00
5   XO3       code_4                  2020-09-20 09:35:00
8   XO3       code_4                  2020-10-10 11:35:00

【讨论】:

    猜你喜欢
    • 2018-05-04
    • 2020-01-19
    • 2023-04-03
    • 2019-12-15
    • 2017-12-14
    • 2021-08-01
    • 1970-01-01
    • 2019-11-03
    • 2019-04-19
    相关资源
    最近更新 更多