HBase高可用HMaster进入Active状态重复重启失败
问题描述:
CDH下服务角色列表Hbase中没有Active的Master;
集群告警提示 “未见活动的Master” ;
Hbase的Master WebUI中查看Current Active Master主机,实际状态为 “backup” ;
Hbase节点 /var/log/hbase/ 目录下查看日志;
报错信息:FileSystem closed
导致问题的原因:
由于某些已知存在的问题,会导致MasterProcWals状态日志过多,如果重启HBase Master,可能会导致HBase Master启动失败。因为HBase Master进入活动状态需要读取并实例化所有正在运行的程序当前记录在/hbase/MasterProcWALs/目录下对应的文件。如果此文件夹太大,HBase Master将在完全变为活动状态之前超时并崩溃。
解决过程
1.查看/hbase/MasterProcWALs目录占用HDFS存储空间大小:
// 查看目录占用HDFS存储空间大小
hdfs dfs -du -s -h /hbase/MasterProcWALs

本文围绕HBase高可用HMaster进入Active状态重复重启失败问题展开。问题表现为CDH下Hbase无Active的Master等,原因是MasterProcWals状态日志过多致启动超时崩溃。解决过程包括查看目录大小、移动数据、检查命令、处理zookeeper信息、重启集群等,最终Hbase恢复正常。

1103

被折叠的 条评论
为什么被折叠?



