【发布时间】:2020-07-12 11:13:20
【问题描述】:
对于这个问题,我们来举个例子。我有一个如下所示的数据框 (df.head()):
Unnamed: 0 PacketTime FrameLen FrameCapLen ... Speed Delay Loss Interval
0 1 0.056078 116 116 ... 25 0 0 0
1 2 0.056106 66 66 ... 25 0 0 0
2 3 2.058089 116 116 ... 25 0 0 2
3 4 2.058115 66 66 ... 25 0 0 2
4 5 4.060316 116 116 ... 25 0 0 4
[5 rows x 23 columns]
如您所见,这些组位于 Interval 列旁边。我知道 pandas 有一个df.groupby(colname),但我想做的是对间隔行进行分组,以便将列值一起列出。这将给出一个示例输出,如下所示:
Unnamed: 0 PacketTime FrameLen FrameCapLen ... Speed Delay Loss Interval
0 1 0.000028 116,66 116,66 ... 25,25 0,0 0,0 0
1 2 0.000026 116,66 116,66 ... 25,25 0,0 0,0 2
...
[5 rows x 23 columns]
如您所见,期望的最终结果是将列分组到间隔组的列表中,并组合数据包时间,使得每个间隔组的值为max(PacketTime)-min(PacketTime)。
【问题讨论】:
-
为什么输出中的
Unnamed: 0列聚合为1、2?我猜应该是1, 2,3, 4,对吧?