起因:
目前公司的测试环境和生产环境集群都是由本人搭建,技术选型只要基于CDH6.2.0-1.cdh6.2.0.p0.967373进行集群安装,并增加自定义组件以支持业务。
现象:
在无任何改动的情况下,最近出现WebUI状态无显示的问题,通过ClouderaManager无法对集群进行重启、停止等操作,相当于整个集群脱离页面控制。但本身的内部组件并未受到影响,如Hive、Spark、HDFS等组件依然正常使用。启动Service Monitor、Host Monitor 也没反应、无报错。
首页状态如下图(没有任何反应,且无法完成重启等操作):
排查记录:
1.在排查的过程中,首先是对集群服务进行了重启,一般来说,重启能解决大部分无法解决的问题(笑)。本步记录如下:
# 每个agent节点执行
systemctl stop cloudera-scm-agent
# 在server节点执行
systemctl restart cloudera-scm-server
# 每个agent节点执行
systemctl start cloudera-scm-agent
很遗憾,从结果来看这个问题并不是那么好搞定的。
&nbs


1052

被折叠的 条评论
为什么被折叠?



