【发布时间】:2015-08-25 18:39:29
【问题描述】:
我希望 Google 的某个人就Cloud Bigtable 服务提供的持久性和可用性保证提供一些指导。
这是我目前的理解:
最小集群需要 3 个节点这一事实表明,至少在一个区域内,数据具有高度持久性,并且可以复制到 3 个节点。
但是,Google 员工的 this answer 声明“Cloud Bigtable 不会复制数据”——这与 Cloud Bigtable homepage 上的引述直接矛盾,后者声称它“采用复制的存储策略构建”。那么它是哪一个?是复制还是不复制?如果有,保留多少份?
只能在特定区域内设置集群这一事实表明,集群的可用性与该区域的可用性直接相关。那么如果我想拥有一个高可用的基于 Bigtable 的数据存储,最好是跨多个区域设置独立的集群并自己处理跨集群的写入同步吗?
没有关于跨区域的 Bigtable 集群是否独立的信息。如果我要跨多个区域设置集群,并且一个区域出现故障,我们是否可以期望其他区域中的集群继续工作?或者是否存在一些潜在的单点故障,甚至会影响跨区域的集群?
与对这些细节非常具体的 App Engine 数据存储区相比,Cloud Bigtable 文档相当缺乏 — 或者,至少,我还没有找到详细介绍这些方面的页面。
Cloud Bigtable 文档在其他方面也同样含糊不清,例如关于值的大小限制,the documentation 声明单个值应保持在“每个单元格约 10 MB”以下。 “~10 MB”到底是什么意思?!我可以硬编码一个正好为 10MB 的限制,并期望它始终有效,还是会因未知因素而每天发生变化?
无论如何,如果我听起来很激动,请道歉。我真的很想使用 Bigtable 服务。但我和其他许多人一样,需要先了解它的耐用性/可用性方面,然后才能对其进行投资。谢谢。
【问题讨论】:
标签: high-availability google-cloud-platform google-cloud-bigtable