【发布时间】:2023-02-03 01:16:48
【问题描述】:
假设我有这样的数据集:
item_id | date | cat |
----------------------------
0 | 2020-01-01 | A |
0 | 2020-02-01 | B |
1 | 2020-04-01 | A |
2 | 2020-02-01 | C |
2 | 2021-01-01 | B |
所以,我需要得到最后一个类别(猫列),这意味着结果数据框如下:
item_id | cat |
---------------
0 | B |
1 | A |
2 | B |
我知道我可以按日期对值进行排序,然后遍历项目,但这会消耗太多资源。大熊猫还有另一种方法可以实现吗?
【问题讨论】:
-
df.drop("date", axis=1).groupby("item_id", as_index=False).last()?