【发布时间】:2013-07-29 19:29:19
【问题描述】:
我正在尝试为我正在为客户端运行的基准测试创建一个平台,该客户端包括 Cassandra 作为用于大量写入吞吐量负载的数据库。
有大量的指标(时间序列)需要存储,并且认为每个指标都应该存储为 CQLTable / Column Family。
第一个问题是创建它们(约 10M 指标)需要几天时间(运行 4 节点集群)。
我尝试使用executemany(python cql)进行批量处理,但延迟的“服务时间”大致相同。
任何人都可以建议更好的方法吗?
【问题讨论】: