Cloudera Manager server服务器系统损坏后恢复

本文档记录了一次在Cloudera Manager(CM)节点服务器遭遇问题需要重装后,如何重新安装并接管原有集群的过程。主要步骤包括:拷贝hosts文件,关闭防火墙,安装ntp服务,复制CM的yum源和数据库连接驱动,安装cloudera-scm-server,配置数据库连接,启动服务,以及重新添加和配置集群服务。虽然未备份导致丢失监控数据,但通过此方法能快速恢复集群运行。

    昨天遇到了开发的一个集群cm节点服务器无法登陆,必须系统重装的场景,重装后需要重新安装cm server并接管原集群,主要参考了下面链接的操作步骤:如何迁移Cloudera Manager节点

由于拿到该服务器时系统已重装,系统盘下的相关配置文件已无法恢复,故没有做备份操作,实际证明不备份也可实现重新接管,只是丢失了原有的监控数据和历史命令信息。

1. 拷贝其它集群节点的hosts文件,并将cm节点主机名修改正确

2. 关闭防火墙、透明大页面等,该步骤与集群安装前准备相同,不赘述

3. 安装ntp服务,确认ntp服务器配置,这个集群原来是cm节点做为ntp server的,还是这么设定,就不必修改其它节点的配置了

4. 拷贝cm的yum源文件、数据库连接驱动

5. 安装cloudera-scm-server

6. 修改cm的数据库配置文件/etc/cloudera-scm-server/db.properties 指向原数据库

7. 启动cloudera-scm-server

8. 由于该节点原来部署了hdfs datanode,hms,resourcemanager等服务,已无法正常启动,查看namenode界面后发现缺少该节点的数据副本并不会导致数据丢失,为了快速恢复集群就简单粗暴的将该节点原服务都删除并将host从cm中删除再重新添加服务,若数据有丢失的情况,不建议这样操作

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值