【发布时间】:2016-07-08 16:35:11
【问题描述】:
我正在尝试按一/两列分组,对第四列的值求和并在第五列中找到平均值。每个操作都写在单独的输出中。感觉有点棘手,甚至开始。
输入:无标题,行数超过 100k
StartTime, EndTime,Day,SumCount,UniqueCount
00:00:00,01:00:00,Mon,13534,594
01:00:00,02:00:00,Mon,16674,626
02:00:00,03:00:00,Mon,23736,671
03:00:00,04:00:00,Mon,16977,671
00:00:00,01:00:00,Tue,17262,747
01:00:00,02:00:00,Tue,19072,777
02:00:00,03:00:00,Tue,18275,785
03:00:00,04:00:00,Tue,13589,757
04:00:00,05:00:00,Tue,16053,735
05:00:00,06:00:00,Tue,11440,636
我要找的是
- Groupby
StartTime&EndTime求和SumCount和中位数UniqueCount - Groupby
DayfindSumCount的总和和UniqueCount的中位数
我不知道如何将两种类型的 groupby 放在一个程序中并获得两种不同的输出。
【问题讨论】:
标签: python pandas dataframe aggregate median