何时向 Cassandra Ring 添加更多节点 - DSE 4答案

【问题标题】：When to add more nodes to Cassandra Ring - DSE 4何时向 Cassandra Ring 添加更多节点 - DSE 4
【发布时间】：2014-07-06 04:20:40
【问题描述】：

我正在寻找有关何时应将更多 Cassandra 服务器添加到环的文档或一般指南。这应该基于磁盘使用情况还是其他监控因素？

目前我对 CoordinatorReadLatency、ReadLatency 和 DroppedMessages.REQUEST_RESPONSE 有一些顾虑，但我再次找不到关于如何解释我正在监视的各种组件的好的指南。我可以找到很好的性能调优指南，但关于 devops 的信息有限。

我知道这个问题可能与服务器故障更相关，但他们没有 Datastax Enterprise 的标签。

提前致谢

基于@bcoverston 的回复的后续步骤

Nodetool 提供对读取和写入延迟指标的访问：nodetool cfhistrograms

在此处查看文档：http://www.datastax.com/documentation/cassandra/2.0/cassandra/tools/toolsCFhisto.html?scroll=toolsCFhisto#

由于我们想将其绑定到漂亮的图表中，nodetool 源代码将我们指向正确的 jmx 值

https://github.com/apache/cassandra/blob/trunk/src/java/org/apache/cassandra/tools/NodeTool.java#L82

每个 cf 都有写入和读取延迟指标。

【问题讨论】：

标签： cassandra datastax-enterprise datastax

【解决方案1】：

这个问题有点开放式，这取决于您的用例。有很多事情要监控，查看所有可能的设置并决定是否需要增加集群大小可能会让人不知所措。

这里的一般建议是，您应该监控读取和写入延迟，确定阈值应该在哪里，并相应地规划您的容量。因为没有用于运行 Cassandra 的限制性硬件，而且您的用例对于您所做的任何事情都是独一无二的，因此只有经验法则。

根据数据/节点调整集群大小可能会有所帮助，但前提是我知道您的工作集有多大，以及您的延迟目标是什么。此外，存储介质的速度也很重要。

根据延迟调整集群规模更有意义。如果你需要做 N tx/second，你可以根据你的工作量测试你的硬件，看看它是否能满足你的目标。请记住，当您执行此操作时，您需要进行长期测试以查看这些目标是否以持续的方式保持，以及在该负载下的性能何时以及是否会降级需要多长时间（a写入繁重的工作量会随着时间的推移而降低，您需要在开始错过目标之前增加容量）。

【讨论】：

感谢您的反馈，监控写入和读取延迟的推荐做法是什么？我可能有监控数据，但我正在查看一堆数据。
这里的 datastax 网站上有一篇很好的文章 [1] 特别是该文章底部的链接涵盖了您可以监控的特定 mbean 的平均延迟。 [1]datastax.com/documentation/cassandra/2.0/cassandra/operations/…