【发布时间】:2013-07-12 14:31:23
【问题描述】:
在我的 Cassandra 节点上定期运行 nodetool repair 会削弱它们吗?
Planet Cassandra FAQ 说明(强调)
反熵节点修复 - 对于不经常读取的数据,或更新已停机较长时间的节点上的数据,节点修复过程(也称为反熵修复)确保所有副本上的数据保持一致。节点修复(使用 nodetool 实用程序)应作为常规集群维护操作的一部分定期运行。
这是我见过的唯一一个定期运行nodetool repair 的参考。如果它便宜,定期运行它不会有问题,但它到底有多贵?它是否相当于对节点上的每条记录进行一致性检查读取?还是比这更聪明?文档中提到了 Merkle 树的使用,但这并没有让我知道该操作有多昂贵。
如果您在一个节点上有 500 GB 的数据,并且该节点实际上与其他节点一致(修复是无操作),那么修复从磁盘读取多少数据(读取所有 500 GB 将需要几个小时)?以及通过 LAN 发送的数据量(通过 LAN 发送全部 500 GB 可能需要另一个小时左右)。
【问题讨论】:
标签: cassandra maintenance nodetool