【发布时间】:2013-05-14 19:13:52
【问题描述】:
有没有办法根据 HBase 中特定列的值将记录从 HBase 加载到猪关系中?谢谢你
【问题讨论】:
标签: hadoop mapreduce hbase hive apache-pig
有没有办法根据 HBase 中特定列的值将记录从 HBase 加载到猪关系中?谢谢你
【问题讨论】:
标签: hadoop mapreduce hbase hive apache-pig
如果您查看source code for the pig HBase loader,您会发现它可以过滤键范围和时间戳,它可以按前缀获取列,但不能按列值过滤。
您可以编写自己的加载程序(甚至基于该代码)并添加您需要的功能。请注意,无论如何过滤列值的性能都不会很好,并且在映射器中过滤该值虽然比在 HBase 过滤器中过滤慢,但不会有那么不同(您基本上可以保存来自 regionserver 的进程间通信给猪映射器)
【讨论】: