在HDFS集群中只有一个namenode节点,管理所有元数据是,当当前namenode节点无法启动时,这个集群处于瘫痪状态,无法对外服务,还有可能造成大量数据丢失的风险(单点故障问题)
如何避免单点故障?
1配置两个namenode(一台处于活跃状态,一台处于等待状态);
2将操作记录存入到外部的日志管理系统,等待状态的namenode定期的去读取日志数据,查看用户的操作记录,反序列化到Fsimage;
3zookeeper监控机器的状态,当活跃状态的namenode宕机后,等待状态的namenode迅速切换到活跃状态;
相关文章: