【发布时间】:2017-03-11 13:53:12
【问题描述】:
在 Jeff Carpenter 和 Eben Hewitt 的“Cassandra The Definitive Guide”(第 2 版)中,使用以下公式计算磁盘上表的大小(对模糊部分表示歉意):
- ck:主键列
- cs:静态列
- cr:常规列
- cc:聚类列
- Nr:行数
- Nv:它用于计算时间戳的总大小(我没有完全理解这部分,但现在我将忽略它)。
这个等式有两点我不明白。
第一:为什么要为每个常规列计算聚类列的大小?我们不应该将它乘以行数吗?在我看来,通过这种方式计算,我们是说每个聚类列中的数据会针对每个常规列进行复制,我认为情况并非如此。
第二:为什么主键列不乘以分区数?根据我的理解,如果我们有一个具有两个分区的节点,那么我们应该将主键列的大小乘以 2,因为我们将在该节点中有两个不同的主键。
【问题讨论】:
标签: cassandra