【发布时间】:2015-06-11 12:25:54
【问题描述】:
我想知道是否可以编写一个在 HBase 上执行 BulkLoad 的 java 程序。我在 hadoop 集群上,但由于某种原因我不需要编写 MapReduce Job。
谢谢
【问题讨论】:
我想知道是否可以编写一个在 HBase 上执行 BulkLoad 的 java 程序。我在 hadoop 集群上,但由于某种原因我不需要编写 MapReduce Job。
谢谢
【问题讨论】:
BulkLoad 与 HFile 一起使用。所以如果你有 HFiles,你可以直接使用 LoadIncrementalHFiles 来处理批量加载。 一般我们使用 Map reduce,它可以将数据转换为上述格式,并执行 Bulk Load。 如果您有 csv 文件,您可以使用 ImportTsv 实用程序将您的数据处理成 HFiles。使用this link,了解更多信息 这取决于您当前的数据格式。 需要注意的是,Bulk Load,不要使用 Write ahead Logs(WAL)。他们跳过这一步并以更快的速度添加数据。如果您有任何其他依赖于上述 WAL 的框架,请考虑在 Hbase 中添加数据的其他选项。快乐编码。
【讨论】: