【发布时间】:2020-09-08 17:49:15
【问题描述】:
我有一个系统可以存储来自具有许多传感器的机器的测量值,每秒一次。我正在考虑使用 Cassandra,并希望将 1 秒的机器状态测量样本存储在一个表中,类似于:
create table inst_samples (
machine_id text,
batch_id int,
sample_time timestamp,
var1 double,
var2 double,
.....
varN double,
PRIMARY KEY ((machine_id, batch_id), sample_time)
);
大约有 20 台机器,每台机器有 400 个状态变量,batch_id 将每 1-2 小时更新一次。我已经查看了关于每张表最多 20 亿个单元格的文档,并注意到了类似的问题 这里是What are the maximum number of columns allowed in Cassandra,这里是Cassandra has a limit of 2 billion cells per partition, but what's a partition?
如果我正确理解了这个限制,我会在大约 60 天内达到 inst_samples 表中单台机器的 20 亿个单元格限制吗?
(2e9 个单元格/400 列/行)/(3600 行/小时)/(24 小时/天)=~ 58 天?
我完全是 Cassandra 新手。谢谢。
【问题讨论】: