【发布时间】:2021-02-18 02:35:16
【问题描述】:
我无法理解使用的方法。我有以下数据框:
df = {'CODE': ['BBLGLC70M','BBLGLC70M','ZZTNRD77', 'ZZTNRD77', 'AACCBD', 'AACCBD', 'BCCDN', 'BCCDN', 'BCCDN'],
'DATE': ['16/05/2019','25/09/2019', '16/03/2020', '27/02/2020', '16/07/2020', '21/07/2020', '13/02/2020', '23/07/2020', '27/02/2020'],
'TYPE': ['PRI', 'PRI', 'PRI', 'PRI', 'PUB', 'PUB', 'PUB', 'PRI', 'PUB'],
'DESC' : ['KO', 'OK', 'KO', 'KO', 'KO', 'OK', 'KO', 'OK', 'OK']
}
df = pd.DataFrame(df)
df['DATE'] = pd.to_datetime(df['DATE'], format = '%d/%m/%Y')
df
我需要:
- 按相同的“代码”分组,
- 检查“DESC”是否不相同
- 检查“类型”是否相同
- 计算满足前 2 个命令的日期之间的月差
预期的输出如下:
【问题讨论】:
-
嗨,你自己试过什么?
-
您好,我已经尝试创建一个数据透视表,其中代码、类型和日期作为索引,而 desc 作为等于 size() 的值。然后我有 df.groupby(level=0)['DATE'].transform(lambda x: x[0] - x[1]) 这是我弄错了...
标签: pandas datetime pandas-groupby pivot-table hierarchical-clustering