【发布时间】:2023-03-12 09:49:01
【问题描述】:
我正在使用表映射器在 HBase 上编写 mapreduce 作业。我想跳过没有特定列的行。例如,如果映射器从“元”族、“源”限定符列中读取,则映射器应该期望该列中有某些内容。我知道我可以向扫描对象添加列,但我希望这只会限制扫描可以看到哪些行,而不是哪些列需要存在。
我可以使用什么过滤器来跳过没有我需要的列的行?
另外,过滤器概念本身有点奇怪。过滤器是逐行操作还是逐键值操作? “过滤一行”是指跳过该行或包含它,还是简单地将其通过过滤器?
有没有比 hbase javadocs 解释得更清楚的地方?
【问题讨论】:
标签: java filter mapreduce hbase