【发布时间】:2016-12-11 01:20:38
【问题描述】:
我的团队正在考虑导出/导入大表数据,但只是出于技术问题考虑列族的一个子集(不是全部)。
这些文档似乎表明只能对整个 bigtable 进行导出/导入。
https://cloud.google.com/bigtable/docs/exporting-sequence-files https://cloud.google.com/bigtable/docs/importing-sequence-files
由于 bt 的大小,我们希望避免导出整个 bt(并且我们只需要备份/恢复特定的列族)。
也许有一个我们不知道的简单解决方案,所以我想我会在这里问。
我们想到的另一种方法是使用 Dataflow 扫描特定的列族,将数据转储到 GCS(通过保留快照),并在需要时恢复数据。但是如果我们不需要使用 Dataflow,那对我们来说会是一个更好的解决方案。
任何帮助和建议将不胜感激!
【问题讨论】: