【发布时间】:2017-12-29 21:33:52
【问题描述】:
我正在预处理 apache 服务器日志数据。我有 3 列 ID、TIME 和 BYTES。示例:
ID     时间     字节
1     13:00     10
2     13:02     30
3     13:03     40
4     13:02     50
5     13:03     70
我想实现这样的目标:
ID     时间     字节
1     13:00     10
2     13:02     80
3     13:03     110
【问题讨论】:
-
df.groupby('TIME', as_index=False).agg({'ID': 'min', 'BYTES': 'sum'})可以。 -
确实如此。 @Zero,你能找到骗子吗?
-
它搞砸了时间。现在时间以某种奇怪的模式从 0:00 开始。就我而言,ID并不重要。所以,这只是时间和字节。我希望输出像我展示的那样(因为我会根据时间绘制图表)。如图所示,输出必须按 TIME 顺序排列。 @Zero,你有什么建议?
-
TIME的dtype是什么?
-
df.groupby('TIME')[['BYTES']].sum().plot()?
标签: python-3.x pandas pandas-groupby data-scrubbing