【发布时间】:2019-05-02 21:43:44
【问题描述】:
我们有一个跨 2 个不同数据中心的 12 节点 cassandra 集群。我们正在通过网络应用程序将数据从 sql DB 迁移到 cassandra,并且还有另一个 .net 应用程序从 cassandra 读取数据。最近关闭,我们看到一个或另一个节点出现故障(nodetool 状态显示 DN 并且服务已停止)。下面是 nodetool 状态的输出。我们必须启动服务才能让它再次工作,但它又停止了。
https://ibb.co/4P1T453
【问题讨论】:
-
请问可以直接在问题中添加相关日志sn-ps,而不是链接到其他网站吗?
-
您能分享一下您属于任何 Down 节点的“cassandra.yaml”文件吗?
-
WARN [main] 2019-04-24 00:05:30,075 NativeLibrary.java:187 - 无法锁定 JVM 内存 (ENOMEM)。这可能导致部分 JVM 被换出,尤其是在启用 mmapped I/O 的情况下。增加 RLIMIT_MEMLOCK 或以 root 身份运行 Cassandra。 WARN [main] 2019-04-24 00:05:30,075 StartupChecks.java:127 - 无法预加载 jemalloc 共享库以加快内存分配 WARN [main] 2019-04-24 00:05:30,076 StartupChecks.java: 160 - 未启用 JMX 来接收远程连接。请参阅 cassandra-env.sh 了解更多信息。
-
INFO [StorageServiceShutdownHook] 2019-04-24 00:02:08,962 HintsService.java:220 - 暂停提示调度 INFO [StorageServiceShutdownHook] 2019-04-24 00:02:08,975 Server.java:176 - 停止侦听 CQL 客户端 INFO [StorageServiceShutdownHook] 2019-04-24 00:02:08,976 Gossiper.java:1530 - 宣布关闭 INFO [StorageServiceShutdownHook] 2019-04-24 00:02:08,977 StorageService.java:2255 - 节点 / 10.10.52.21 状态跳转到关机
-
INFO [StorageServiceShutdownHook] 2019-04-24 00:02:10,979 MessagingService.java:984 - 等待消息服务停止 INFO [ACCEPT-/10.10.52.21] 2019-04-24 00: 02:10,980 MessagingService.java:1338 - MessagingService 已终止 accept() 线程