【发布时间】:2020-06-01 14:35:38
【问题描述】:
我有一个大的 csv,格式如下:
timestamp,name,age
2020-03-01 00:00:01,nick
2020-03-01 00:00:01,john
2020-03-01 00:00:02,nick
2020-03-01 00:00:02,john
2020-03-01 00:00:04,peter
2020-03-01 00:00:05,john
2020-03-01 00:00:10,nick
2020-03-01 00:00:12,john
2020-03-01 00:00:54,hank
2020-03-01 00:01:03,peter
我将 csv 加载到数据框中:
df = pd.read_csv("/home/test.csv")
然后我想每 2 秒创建多个数据帧。例如:
df1 包含:
2020-03-01 00:00:01,nick
2020-03-01 00:00:01,john
2020-03-01 00:00:02,nick
2020-03-01 00:00:02,john
df2 包含:
2020-03-01 00:00:04,peter
2020-03-01 00:00:05,john
等等。
我用下面的命令实现了分割时间戳:
full_idx = pd.date_range(start=df['timestamp'].min(), end = df['timestamp'].max(), freq ='0.2T')
但是我如何存储这些吐出的数据帧?如何将基于时间戳的数据集拆分为多个数据帧?
【问题讨论】:
-
你想如何存储它?在字典中?
-
我想存储在一个列表中
标签: python pandas python-2.7