【发布时间】:2020-05-17 21:04:51
【问题描述】:
我有一个表单的数据框
date_time uids
2018-10-16 23:00:00 1000,1321,7654,1321
2018-10-16 23:10:00 7654
2018-10-16 23:20:00 NaN
2018-10-16 23:30:00 7654,1000,7654,1321,1000
2018-10-16 23:40:00 691,3974,3974,323
2018-10-16 23:50:00 NaN
2018-10-17 00:00:00 NaN
2018-10-17 00:10:00 NaN
2018-10-17 00:20:00 27,33,3974,3974,7665,27
这是一个非常大的数据框,包含 5 分钟的时间间隔以及在这些时间间隔内出现的 id 的数量。
我想一次迭代这些 DataFrame 6 行(对应于 1 小时)并创建包含 ID 和每个 id 在此期间出现的次数的 DataFrame。
预期输出是每小时一个数据帧的信息。例如,在上述情况下,23 - 00 小时的数据框将具有这种形式
uid 1 2 3 4 5 6
1000 1 0 0 2 0 0
1321 2 0 0 1 0 0
等等
我怎样才能有效地做到这一点?
【问题讨论】:
标签: python python-3.x pandas loops stride