【发布时间】:2020-08-19 21:27:32
【问题描述】:
最近我们的 Cassandra 集群开始出现问题。也许有人对如何解决这个问题有想法。我们在 40 个节点的集群上运行 Cassandra 3.11.7。我们使用复制因子 = 3 并在一致性级别 QUORUM 上读/写。
最近,单个节点经历了 CPU 负载的突然峰值,然后持续了一段时间。在此期间,我们可以观察到大量丢弃和排队的 MUTATION。如果我们在有问题的节点上重新启动 Cassandra,那么一两个其他节点就会开始遇到同样的问题。我们检查了日志文件和访问模式,但尚未找到原因。
此类行为的最常见原因可能是什么?我们应该在哪里仔细观察?有没有人有过类似的经历?
【问题讨论】:
标签: cassandra