【发布时间】:2015-11-25 09:00:35
【问题描述】:
我是 Apache Hbase 的新手,我正在使用 hbase-0.98.13,并且我创建了一个包含列族 sample_family 的表示例。我已经将 pig 脚本的输出加载到 hbase 表中。当我尝试根据列族中的一列扫描表时,需要超过 2 分钟。
这里是查询
scan 'sample', {FILTER=>"SingleColumnValueFilter('sample_family','id',=,'binary:1000')"}
谁能告诉我如何在一两秒内完成这个过程?
是否需要对此进行任何配置更改?任何人都可以帮助我吗?
【问题讨论】:
-
在 HBase 单元格中查询值并不是 HBase 引擎中性能最高的部分。正如@Matik 所说,您应该正确设计行键以实现最大的 HBase 性能。
-
@maxteneff。我怀疑行键值是否必须是唯一的?