【发布时间】:2020-06-17 14:16:26
【问题描述】:
我有一个带有 time, host, value 列的 pandas df
数据如下
time host value
14:00:00 inf1 5000
14:00:00 inf2 2000
14:01:00 inf1 5000
14:01:00 inf1 5000
14:01:00 inf2 2000
我想使用以下代码按时间对它们进行分组:-
df.set_index('time').groupby([pd.Grouper(freq='1Min')]).sum()
但我只想总结唯一主机并忽略任何重复的主机。我想要的输出是
time sum
14:00:00 7000
14:01:00 7000
而不是:-
time sum
14:00:00 7000
14:01:00 12000
我想在 groupby 期间忽略重复的主机。
【问题讨论】: