【发布时间】:2017-02-13 01:03:01
【问题描述】:
当前设置,cassandra 2.2.5,gossip 默认为 1 秒,phi 阈值为 8。我面临的问题是提示中的尖峰。提示上升的原因之一是节点被标记为关闭(八卦尚未传达 phi 阈值)。
我读过一篇文章,它说 phi 阈值 8 对应于 18 秒,这里或那里将是几秒钟。现在我需要了解是什么原因,是什么阻止了八卦交流 18 秒。八卦沟通需要满足哪些清单?
【问题讨论】:
当前设置,cassandra 2.2.5,gossip 默认为 1 秒,phi 阈值为 8。我面临的问题是提示中的尖峰。提示上升的原因之一是节点被标记为关闭(八卦尚未传达 phi 阈值)。
我读过一篇文章,它说 phi 阈值 8 对应于 18 秒,这里或那里将是几秒钟。现在我需要了解是什么原因,是什么阻止了八卦交流 18 秒。八卦沟通需要满足哪些清单?
【问题讨论】:
回复:“cassandra gossip 协议和 phi_threshold 是如何工作的?”:Phi 是 approximated,如:phi = (tnow - tLast) / mean 和一个节点 is marked down when phi > phi_threshold / 0.434。对于您的设置(假设平均值为 1 [因为节点通常每隔 1 秒接收一次心跳]),如果我们在 8 / 0.434 = 18.42 秒内没有收到任何心跳,则该节点将被标记为关闭。
记录算法的论文可以在here找到。
Re:“八卦交流需要满足哪些清单?”:对我来说有几件事:
【讨论】:
storage_port 配置值。对我来说,在更改值之前在防火墙中打开 7000 端口会更有意义。
hints goes up 时,那是哪个指标? TotalHintsInProgress?
storage_port 的值将不会导致此其他端口上仅发生 gossip 流量,它仅意味着现在此其他端口上发生所有 C* 节点间通信流量。