【发布时间】:2016-10-24 00:17:43
【问题描述】:
假设我有一个具有以下结构的数据框:
observation
d1 1
d2 1
d3 -1
d4 -1
d5 -1
d6 -1
d7 1
d8 1
d9 1
d10 1
d11 -1
d12 -1
d13 -1
d14 -1
d15 -1
d16 1
d17 1
d18 1
d19 1
d20 1
其中 d1:d20 是一些日期时间索引(此处概括)。
如果我想将 d1:d2、d3:d6、d7:d10 等拆分为各自的“块”,我将如何以 Python 方式执行此操作?
注意:
df1 = df[(df.observation==1)]
df2 = df[(df.observation==-1)]
不是我想要的。
我能想到蛮力的方法,这可行,但不是非常优雅。
【问题讨论】:
-
你如何获得这些数据?
pandas.read_csv()有自己的chunksize参数 -
@StevenG 这些是分析值,这是一个简化的示例。基本上,我将拥有具有不同值的顺序数据。我想将这些不同的值组拆分为新的数据框。 chunksize 似乎也需要对传入数据结构的先验知识,而我没有。
-
你希望它如何分块?标准是什么?您是否根据
observation的更改时间分块?