源Blog地址:http://blog.csdn.net/yangbutao/article/details/12911487



HBase以往数据的备份基于distcp或者copyTable等工具,这些备份机制或多或少对当前的online数据读写存在一定的影响,Snapshot提供了一种快速的数据备份方式,无需进行数据copy。

参见下图

HBase snapshot分析

Snapshot包括在线和离线的,在线方式,

离线方式是disabletable,由HBase Master遍历HDFS中的table metadatahfiles,建立对他们的引用。

在线方式是enabletable,由Master指示region server进行snapshot操作,在此过程中,masterregionserver之间类似两阶段commitsnapshot操作。

HBase snapshot分析

HFile是不可变的,只能appenddelete regionsplitcompact,都不会对snapshot引用的文件做删除(除非删除snapshot文件),这些文件会归档到archive目录下,进而需要重新调整snapshot文件中相关hfile的引用位置关系。

HBase snapshot分析

 

基于snapshot文件,可以做clone一个新表,restore,export到另外一个集群中操作;其中clone生成的新表只是增加元数据,相关的数据文件还是复用snapshot指定的数据文件

参见clone新表操作示意图:

HBase snapshot分析

snashot相关的操作命令如下,

快照:

   hbase> snapshot 'myTable','myTableSnapshot-122112'

列出当前所有得快照: 

    hbase> list_snapshots

删除快照信息: 

  hbase> delete_snapshot'myTableSnapshot-122112'

基于快照,clone一个新表: 

  hbase> clone_snapshot'myTableSnapshot-122112', 'myNewTestTable'

基于快照恢复表: 

  hbase> disable 'myTable'

    hbase> restore_snapshot'myTableSnapshot-122112'

 导出到另外一个集群中:

$bin/hbase class org.apache.hadoop.hbase.snapshot.tool.ExportSnapshot -snapshotMySnapshot -copy-to hdfs:///srv2:8082/hbase -mappers 16



参考来源

Apache HBase快照介绍

HBase snapshot分析


http://hbase.apache.org/0.94/book/ops.snapshots.html




相关文章:

  • 2021-12-28
  • 2021-12-17
  • 2021-06-28
  • 2021-10-31
  • 2021-10-13
  • 2021-10-16
  • 2021-09-23
  • 2022-01-07
猜你喜欢
  • 2021-10-29
  • 2022-12-23
  • 2021-09-20
  • 2021-07-21
  • 2022-12-23
  • 2021-04-21
  • 2021-10-29
相关资源
相似解决方案