【发布时间】:2016-03-10 08:03:06
【问题描述】:
我在多个文件(存储在存储桶中)中有一个大型 csv 数据集 (>5TB),我需要将其导入 Google Bigtable。文件格式为:
行键,s1,s2,s3,s4
文本,整数,整数,整数,整数
...
有一个带有 hbase 的 importtsv 函数会很完美,但是在 Windows 中使用 Google hbase shell 时似乎不可用。可以使用这个工具吗?如果没有,实现这一目标的最快方法是什么?我对 hbase 和谷歌云没有什么经验,所以一个简单的例子会很棒。我见过一些使用 DataFlow 的类似示例,但除非必要,否则我不希望学习如何执行此操作。
谢谢
【问题讨论】:
标签: csv bigtable google-cloud-bigtable