【问题标题】:Distributed Network B+trees分布式网络 B+树
【发布时间】:2012-01-19 15:33:35
【问题描述】:

我想构建一个跨越多节点的 B+树
计算机网络(Linux PC 的内部子网)
弹性海量存储。范围扫描很重要。

这基本上是
的底层数据结构吗 分布式数据库系统? (卡桑德拉,HBase)

有没有关于分布式 B+树的研究?
我在
http://www.cs.yale.edu/homes/aspnes/papers/opodis2005-b-trees-final.pdf看到了这篇文章
但是跳过 BTrees 只是将故障节点取出(所以会有数据丢失)

我对具有内置冗余的 B+Trees 特别感兴趣
(即,如果主机发生故障并且其托管的所有节点都处于脱机状态,
我希望另一台复制主机成为主节点
服务器并代替故障主机)

我不想使用数据库实例集合
(1 个节点,1 个 DB)作为分片不是一个好的选择
用于大规模存储系统(跨商品
x86、x64 硬件与 FOSS 操作系统)。

我是在重新发明轮子吗?
我应该只使用 Cassandra 还是 HBase?

【问题讨论】:

    标签: distributed-computing b-tree network-storage


    【解决方案1】:

    Cassandra 支持范围查询。

    当您打开机器时,Google 的 Big Table 会自动将新机器添加到集群中。它非常有弹性且易于添加更多机器。不幸的是,它的速度有一个缺点:查询非常严格。你可以做一些范围查询。有关列表和更多详细信息,请参阅本文:http://geothought.blogspot.com/2009/04/google-app-engine-and-bigtable-very.html

    如何在大表中存储数据的一个很好的例子:http://jimbojw.com/wiki/index.php?title=Understanding_Hbase_and_BigTable

    一个不错的堆栈溢出帖子: storing massive ordered time series data in bigtable derivatives

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2014-09-05
      • 2014-05-15
      • 2012-12-19
      • 1970-01-01
      • 2016-05-08
      • 2013-11-09
      • 1970-01-01
      相关资源
      最近更新 更多