【发布时间】:2019-02-21 09:14:29
【问题描述】:
在我的 HBase 表中,每一行的列可能与其他行不同。例如;
ROW COLUMN
1-1040 cf:s1
1-1040 cf:s2
1-1043 cf:s2
2-1040 cf:s5
2-1045 cf:s99
3-1040 cf:s75
3-1042 cf:s135
如上所示,每一行的列与其他行不同。所以,当我像这样运行扫描查询时;
扫描 'tb', {COLUMNS=>'cf:s2', STARTROW=>'1-1040', ENDROW=>'1-1044'}
我想使用上述查询获取 cf:s2 值。但是,是否会因为每行有不同的列而出现任何性能问题?
另一种选择;
ROW COLUMN
1-1040-s1 cf:value
1-1040-s2 cf:value
1-1043-s2 cf:value
2-1040-s5 cf:value
2-1045-s99 cf:value
3-1040-s75 cf:value
3-1042-s135 cf:value
在此选项中,当我想获得介于 1-1040 和 1-1044 之间的 s2 值时,我正在为此运行此查询;
扫描 'tb', {STARTROW=>'1-1040s2', ENDROW=>'1-1044', FILTER=>"RowFilter(=, 'substring:s2')"}
当我想获得 s2 值时,哪个选项的读取性能更好?
【问题讨论】:
标签: hadoop time-series hbase