Hbase Master 几分钟就死掉的故障排查 和zk host 没关系,最新 hbck2 的用法

本文详细介绍了在HBase中遇到的namespace表元数据异常情况,包括缺失重要信息导致的问题,以及如何使用hbck2工具进行元数据校验和修复。通过具体命令示例,展示了如何检查和解决HMaster频繁重启的问题。

看一下对应的 hfile 文件内容命令

hbase Hfile -e -p -f  /hbase/data/hbase/meta/1588230740/info/5660f2774e0d41d985ac3758ee1db9e3

由于 master 节点一直初始化导致的问题:

查看 namespace 元数据是否正常

echo 'scan "hbase:meta"' | hbase shell | grep 'hbase:namespace'

不正常的情况
Java HotSpot(TM) 64-Bit Server VM warning: Using incremental CMS is deprecated and will likely be removed in a future release
 hbase:namespace column=table:state, timestamp=1593409043862, value=\x08\x00
 
 ------------------------------------------------------------------------------------------
 正常的情况
 
 [root@cdh3 hbase]# echo 'scan "hbase:meta"' | hbase shell | grep 'hbase:namespace'
Java HotSpot(TM) 64-Bit Server VM warning: Using incremental CMS is deprecated and will likely be removed in a future release
 hbase:namespace column=table:state, timestamp=1591088319108, value=\x08\x00
 hbase:namespace,,1591088317613.53b3e66e48c9f0583e2f2908375091b6. column=info:regioninfo, timestamp=1593400711483, value={ENCODED => 53b3e66e48c9f0583e2f2908375091b6, NAME => 'hbase:namespace,,1591088317613.53b3e66e48c9f0583e2f2908375091b6.', STARTKEY => '', ENDKEY => ''}
 hbase:namespace,,1591088317613.53b3e66e48c9f0583e2f2908375091b6. column=info:seqnumDuringOpen, timestamp=1593400711483, value=\x00\x00\x00\x00\x00\x00\x00:
 hbase:namespace,,1591088317613.53b3e66e48c9f0583e2f2908375091b6. column=info:server, timestamp=1593400711483, value=cdh4:16020
 hbase:namespace,,1591088317613.53b3e66e48c9f0583e2f2908375091b6. column=info:serverstartcode, timestamp=1593400711483, value=1593400693384
 hbase:namespace,,1591088317613.53b3e66e48c9f0583e2f2908375091b6. column=info:sn, timestamp=1593400710359, value=cdh4,16020,1593400693384
 hbase:namespace,,1591088317613.53b3e66e48c9f0583e2f2908375091b6. column=info:state, timestamp=1593400711483, value=OPEN

 
 结论:
 生产环境namespace表缺少重要的info:server信息,这将导致namespace region在被AssignmentManager分配时跳过。
 

调用 hbck jar 包 ,校验元数据

 hbase hbck -j hbase-hbck2-1.1.0-SNAPSHOT.jar reportMissingRegionsInMeta ypl:t_url_file

对 region 进行 assigns,可以去页面查看

hbase hbck -j hbase-hbck2-1.1.0-SNAPSHOT.jar  assigns -o e4e90fcb552f9f1b4b177f96c8368de

访问 hbase region 查看是否正常

nohup hbase canary -f false -t 6000000 > ./hbase.log 2>&1 &

主要解决问题:
hbck2 的 region assgin 用法。
hbase 元数据出现异常,恢复。
解决了Hmaster 好几分钟就死掉的原因。
参考网址:
https://mp.weixin.qq.com/s/voejuBNVQXN5pXTKBcdNRg

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值