Hbase的读写流程

Hbase的regionserver里面有内存Memstore和block cache。
Memstore作业主要是写，另一部分主要是读的。
block cache用的是LRU，如果block cache达到上限，会启动淘汰机制。

（1）HRegionServer保存着.META.的这样一张表以及表数据，要访问表数据，首先Client先去访问zookeeper，从zookeeper里面找到.META.表所在的位置信息，即找到这个.META.表在哪个HRegionServer上保存着。

（2）接着Client通过刚才获取到的HRegionServer的IP来访问.META.表所在的HRegionServer，从而读取到.META.，进而获取到.META.表中存放的元数据。

（3）Client通过元数据中存储的信息，访问对应的HRegionServer，然后扫描(scan)所在HRegionServer的Memstore如果没有，扫描block cache（读数据的缓存），如果还没有去Storefile来查询数据，查到数据之后将数据读到block cache。

（4）最后HRegionServer把查询到的数据响应给Client。

流程图：
Hbase的读写流程

（1）Client也是先访问zookeeper，进而找到.META.表，并获取.META.表信息。

（2）确定当前将要写入的数据所对应的RegionServer服务器和Region。

（3）Client向该RegionServer服务器发起写入数据请求，然后RegionServer收到请求并响应。

（4）Client先把数据写入到HLog，以防止数据丢失。

（5）然后将数据写入到Memstore。

（6）如果Hlog和Memstore均写入成功，则这条数据写入成功。在此过程中，如果Memstore达到阈值，会把Memstore中的数据flush到StoreFile中。

（7）当Storefile越来越多，会触发Compact合并操作，把过多的Storefile合并成一个大的Storefile。当Storefile越来越大，Region也会越来越大，达到阈值后，会触发Split操作，将Region一分为二。

提示：因为内存空间是有限的，所以说溢写过程必定伴随着大量的小文件产生。

流程图：
Hbase的读写流程