leojie

1. 为什么要预分区

一张表被首次创建时,只会分配一个region给这个表。因此,在刚刚开始时,所有读写请求都会落在这个region所在的region server上,而不管你整个集群有多少个region server。不能充分地利用集群的分布式特性。

2. 最为常见的建表语句

create \'leo_test1\',{NAME => \'info\'}, { NUMREGIONS => 50, SPLITALGO => \'HexStringSplit\'}

create \'leo_test2\',{NAME => \'info\'}, { NUMREGIONS => 50, SPLITALGO => \'DecimalStringSplit\'}

create \'leo_test3\',{NAME => \'info\'}, { NUMREGIONS => 50, SPLITALGO => \'UniformSplit\'}

各种Split算法适用场景:

  • HexStringSplit: rowkey是十六进制的字符串作为前缀的

  • DecimalStringSplit: rowkey是10进制数字字符串作为前缀的

  • UniformSplit: rowkey前缀完全随机

分类:

技术点:

相关文章: