【问题标题】:Cassandra Create Table/CF latencyCassandra 创建表/CF 延迟
【发布时间】:2013-07-29 19:29:19
【问题描述】:

我正在尝试为我正在为客户端运行的基准测试创建一个平台,该客户端包括 Cassandra 作为用于大量写入吞吐量负载的数据库。 有大量的指标(时间序列)需要存储,并且认为每个指标都应该存储为 CQLTable / Column Family。
第一个问题是创建它们(约 10M 指标)需要几天时间(运行 4 节点集群)。 我尝试使用executemany(python cql)进行批量处理,但延迟的“服务时间”大致相同。 任何人都可以建议更好的方法吗?

【问题讨论】:

    标签: python cassandra cql


    【解决方案1】:

    您不应为每个列族创建单独的列族 - 10M 列族太多了,因为每个 CF 占用固定资源。

    您最好将它们放在一个 CF 中。您可以将指标名称添加为复合主键的组成部分,例如

    create table metrics (
        metric text,
        day timestamp,
        time timestamp,
        value text,
        primary key ((metric, day))
    );
    

    day 字段用于按天对指标进行分片,因此对于给定指标,它们不会都在同一行中。

    【讨论】:

      猜你喜欢
      • 2018-01-04
      • 1970-01-01
      • 2013-11-30
      • 2017-01-29
      • 2011-03-04
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多