【发布时间】:2015-06-22 06:03:16
【问题描述】:
我想尽可能高效地存储大量时间序列。速度很重要,但不如存储重要。
我的数据由股票名称和 15 年的 1 分钟数据组成。 数据从 2000 年 1 月 1 日开始精确,每天的分钟数正好是 390 分钟。
所以我不需要存储每个系列的时间戳,因为我可以自动计算。
所以不要这样:
Apple [timeStamp:value][timeStamp:value]
我想要这个:
Apple [value][value]
有没有办法在 Cassandra 中加载这种数据,所以它只存储顺序值,而不是每个值的时间戳。
据推测,通过为每个系列使用时间戳会使所需的存储空间增加一倍:如果每个时间戳和值都是 8 字节,那么如果只存储值,它将占用 50 TB 而不是 25 TB。
【问题讨论】:
标签: cassandra storage time-series