【问题标题】:Efficiently numeric storage in CassandraCassandra 中的高效数字存储
【发布时间】:2016-06-01 21:37:07
【问题描述】:

我在一个有 75 亿行的 Cassandra 表中存储了许多小数字。许多数字可以表示为 tinyint(1 字节),但 Cassandra 似乎不支持任何小于 4 字节的数字数据类型。 https://docs.datastax.com/en/cql/3.0/cql/cql_reference/cql_data_types_c.html

我的表大约有 4 TB,我希望减小大小。 varint 是我的答案(“任意精度整数”)吗? varint 在内存中是如何表示的,它的最小尺寸是多少?

或者,是否有可以帮助这种特定情况的首选压缩配置?

【问题讨论】:

    标签: cassandra


    【解决方案1】:

    您正在查看旧版本的文档。由于 Cassandra 2.2 支持 smallinttinyint。见enter link description here

    如果您担心磁盘使用量,我建议您使用 Cassandra 3.x。

    【讨论】:

    • 对 3.x 有哪些影响磁盘使用的相关更改?
    • 看看datastax.com/2015/12/storage-engine-30。例如。在 2.x 中,每个单元格都有一个时间戳,在 3.x 中,如果行单元格同时插入且未更改,则该行中只有一个时间戳。
    猜你喜欢
    • 1970-01-01
    • 2012-10-23
    • 1970-01-01
    • 1970-01-01
    • 2016-07-20
    • 2015-11-24
    • 1970-01-01
    • 2013-01-20
    • 1970-01-01
    相关资源
    最近更新 更多