分布式网络 B+树答案

【问题标题】：Distributed Network B+trees分布式网络 B+树
【发布时间】：2012-01-19 15:33:35
【问题描述】：

我想构建一个跨越多节点的 B+树
计算机网络（Linux PC 的内部子网）
弹性海量存储。范围扫描很重要。

这基本上是
的底层数据结构吗分布式数据库系统？（卡桑德拉，HBase）

有没有关于分布式 B+树的研究？
我在
http://www.cs.yale.edu/homes/aspnes/papers/opodis2005-b-trees-final.pdf看到了这篇文章
但是跳过 BTrees 只是将故障节点取出（所以会有数据丢失）

我对具有内置冗余的 B+Trees 特别感兴趣
（即，如果主机发生故障并且其托管的所有节点都处于脱机状态，
我希望另一台复制主机成为主节点
服务器并代替故障主机）

我不想使用数据库实例集合
（1 个节点，1 个 DB）作为分片不是一个好的选择
用于大规模存储系统（跨商品
x86、x64 硬件与 FOSS 操作系统）。

我是在重新发明轮子吗？
我应该只使用 Cassandra 还是 HBase？

【问题讨论】：

标签： distributed-computing b-tree network-storage

【解决方案1】：

Cassandra 支持范围查询。

当您打开机器时，Google 的 Big Table 会自动将新机器添加到集群中。它非常有弹性且易于添加更多机器。不幸的是，它的速度有一个缺点：查询非常严格。你可以做一些范围查询。有关列表和更多详细信息，请参阅本文：http://geothought.blogspot.com/2009/04/google-app-engine-and-bigtable-very.html

如何在大表中存储数据的一个很好的例子：http://jimbojw.com/wiki/index.php?title=Understanding_Hbase_and_BigTable

一个不错的堆栈溢出帖子： storing massive ordered time series data in bigtable derivatives

【讨论】：