【发布时间】:2017-06-18 16:08:06
【问题描述】:
我的应用程序有一个表单的传入数据流
name, datetime, {x, y, z}
或者换句话说,我收到单行数据,列name, datetime, x, y, z。我每隔几分钟就会收到大量数据,其中一些是新的。
我想将此数据存储在熊猫Panel 中。这个存储面板的结构是这样的
panel.items - [name_1,name_2,...,name_n]
panel.major_axis - [datetime1,datetime2,...datetime_m]
panel.minor_axis - [x, y, z]
出于效率原因,Panel 对象的大小似乎不是很可调整。但是,不可能知道datetimes major_axis 将包含什么。我什至有可能在之前的datetime 之间收到一个新的datetime。
我知道知道items 和minor_axis 将包含什么(尽管没有这个限制我会更快乐)。
我想根据需要增加这个存储面板。速度不是问题。向其他使用可转换为面板的其他容器类型开放。有什么建议吗?
想法
我正在尝试将数据临时存储到 dict-of-dict-of-dict 结构中,可能在每次突发后转换为 Panel,然后以某种方式将其与存储 Panel 结合起来。
old_panel = old_panel.set_value(item, major, minor, value) 似乎并没有像文档中那样工作,而且每次创建一个新面板似乎都非常激烈(因为旧面板可能很大)。
【问题讨论】:
标签: python pandas time-series containers panel