【发布时间】:2010-09-16 21:57:18
【问题描述】:
我需要一种方法来对(可能)数百 GB 的数据进行键值查找。理想情况下,基于分布式哈希表的东西可以很好地与 Java 配合使用。它应该是容错的,并且是开源的。
存储应该是持久的,但理想情况下会将数据缓存在内存中以加快速度。
它应该能够支持来自多台机器的并发读取和写入(虽然读取将是常见的 100 倍)。基本上,目的是对 Web 服务的用户元数据进行快速初始查找。
有人可以推荐吗?
【问题讨论】:
-
你在优化什么?例如,读取吞吐量(从多台机器同时读取)、面对机器变得不可用时的容错能力、机器数量少……您还需要写入吗?
-
谢谢,我已经用这些信息编辑了问题。
-
您希望如何分发数据?是否所有数据都对每个节点可用/在/从每个节点可用?在第一种情况下,下一个问题是“为什么要进行分布式查找?”。
标签: java database bigtable key-value-store distributed-database