【发布时间】:2019-05-24 10:36:59
【问题描述】:
我是 python 的新手。我有一个巨大的dataframe,有数百万行和 id。我的数据如下所示:
Time ID X Y
8:00 A 23 100
9:00 B 24 110
10:00 B 25 120
11:00 C 26 130
12:00 C 27 140
13:00 A 28 150
14:00 A 29 160
15:00 D 30 170
16:00 C 31 180
17:00 B 32 190
18:00 A 33 200
19:00 C 34 210
20:00 A 35 220
21:00 B 36 230
22:00 C 37 240
23:00 B 38 250
我想按 id 和 time 对数据进行排序。我想要的预期结果是这样的”
Time ID X Y
8:00 A 23 100
13:00 A 28 150
14:00 A 29 160
18:00 A 33 200
20:00 A 35 220
9:00 B 24 110
10:00 B 25 120
17:00 B 32 190
21:00 B 36 230
23:00 B 38 250
11:00 C 26 130
12:00 C 27 140
16:00 C 31 180
19:00 C 34 210
22:00 C 37 240
15:00 D 30 170
我只想选择 id 的“第一个和最后一个”并消除其余部分。预期结果如下所示:
Time ID X Y
8:00 A 23 100
20:00 A 35 220
9:00 B 24 110
23:00 B 38 250
11:00 C 26 130
22:00 C 37 240
15:00 D 30 170
如何在熊猫中做到这一点?谢谢你的建议
【问题讨论】:
标签: python pandas dataframe group-by pandas-groupby