【发布时间】:2017-08-26 22:45:27
【问题描述】:
我正在读取包含以下数据的 csv 文件:
Create Date, Original Filesize, Number of Encodings
2016-01-27 16:27:10, 855583191, 1
2016-01-27 16:28:11, 854336, 1
2016-01-27 16:28:25, 854336, 1
2016-01-27 16:30:12, 9691559, 1
我想统计表中每两分钟生成的记录数。
例如如果我们从2016-01-27 16:27:00开始
然后从2016-01-27 16:27:01 到2016-01-27 16:29:00,我们有2 记录。
从2016-01-27 16:29:01 到2016-01-27 16:31:00,我们有1 记录等等。
我正在尝试使用pandas,因为我想稍后对其进行一些数据分析。有/没有熊猫有没有简单的方法来做到这一点?
另外,我首先使用mysql 来导出这些数据。如果使用sql更方便,也可以。
【问题讨论】: