【发布时间】:2018-06-03 00:36:00
【问题描述】:
我有一个 pandas 数据框,其中包含如下所示的数据:
ID year_month_id Class
1 201612 A
2 201612 D
3 201612 B
4 201612 Other
5 201612 Other
6 201612 Other
7 201612 A
8 201612 Other
9 201612 A
1 201701 B
因此,一个 ID 可以在特定月份属于任何班级,下个月他的班级可能会发生变化。 现在我想做的是为每个 ID 获取它在特定类别下的月数,以及它所属的最新类别。如下所示:
ID Class_A Class_B Class_D Other Latest_Class
1 2 3 4 0 B
2 12 0 0 0 D
我如何在 python 中实现这一点。 有人可以帮我吗? 另外,由于真实的数据集很大,无法手动验证,我怎样才能获得超过 1 个类别的 ID 列表?
【问题讨论】:
标签: python pandas dataframe group-by pandas-groupby