解释用于最终一致性的 Merkle 树答案

【问题标题】：Explain Merkle Trees for use in Eventual Consistency解释用于最终一致性的 Merkle 树
【发布时间】：2011-07-26 01:42:38
【问题描述】：

Merkle Trees 在多个分布式复制键/值存储中用作反熵机制：

毫无疑问，反熵机制是一件好事 - 瞬态故障只是在生产中发生。我只是不确定我是否理解为什么 Merkle Trees 是流行的方法。

既然两个对等点必须已经有一个排序的键/值哈希空间在手边，为什么不进行线性合并来检测差异？

我只是不相信当您考虑维护成本时，树状结构可以节省任何成本，而且事实上 已经完成了对树叶的线性传递，只是为了序列化网络上的表示。

为了解决这个问题，一个稻草人的替代方案可能是让节点交换哈希摘要数组，它们通过模环位置增量更新和分桶。

我错过了什么？

【问题讨论】：

【解决方案1】：

Merkle 树限制同步时传输的数据量。一般假设是：

Merkle Tree 交换如下所示：

在典型情况下，同步密钥空间的复杂度为 log(N)。是的，在没有共同键的极端情况下，该操作将等效于发送整个排序的哈希列表，O(N)。人们可以通过在写入时动态构建 Merkle 树并将序列化的形式保存在磁盘上来分摊构建 Merkle 树的费用。

我无法谈论 Dynamo 或 Cassandra 如何使用 Merkle 树，但 Riak 停止使用它们进行集群内同步（在大多数情况下，提示切换和读取修复就足够了）。我们计划在一些内部架构位发生变化后将它们添加回来。

【讨论】：