Cloudera Manager 基本介绍(CDH版本)

1.cloudera manager 的概念

    简单来说,Cloudera Manager是一个拥有集群自动化安装、中心化管理、集群监控、报警功能的一个工具(软件),使得安装集群从几天的时间缩短在几个小时内,运维人员从数十人降低到几人以内,极大的提高集群管理的效率。

 

2.cloudera manager 的功能

 

cloudera manager有四大功能:

    • 管理:对集群进行管理,如添加、删除节点等操作。

    • 监控:监控集群的健康情况,对设置的各种指标和系统运行情况进行全面监控。

    • 诊断:对集群出现的问题进行诊断,对出现的问题给出建议解决方案。

    • 集成:多组件进行整合。

 

3. cloudera manager 的架构

    cloudera manager的核心是管理服务器,该服务器承载管理控制台的Web服务器和应用程序逻辑,并负责安装软件,配置,启动和停止服务,以及管理上的服务运行群集。

Cloudera Manager Server由以下几个部分组成:

    • Agent:安装在每台主机上。该代理负责启动和停止的过程,拆包配置,触发装置和监控主机。

    • Management Service:由一组执行各种监控,警报和报告功能角色的服务。

    • Database:存储配置和监视信息。通常情况下,多个逻辑数据库在一个或多个数据库服务器上运行。例如,Cloudera的管理服务器和监控角色使用不同的逻辑数据库。

    • Cloudera Repository:软件由Cloudera 管理分布存储库。

    • Clients:是用于与服务器进行交互的接口:

    • Admin Console :基于Web的用户界面与管理员管理集群和Cloudera管理。

    • API :与开发人员创建自定义的Cloudera Manager应用程序的API。

 

4.Cloudera Manager(CDH5)内部结构、功能包括配置文件、目录位置等

4.1 相关目录 

/var/log/cloudera-scm-installer : 安装日志目录。
/var/log/* : 相关日志文件(相关服务的及CM的)。
/usr/share/cmf/ : 程序安装目录。
/usr/lib64/cmf/ : Agent程序代码。
/var/lib/cloudera-scm-server-db/data : 内嵌数据库目录。
/usr/bin/postgres : 内嵌数据库程序。
/etc/cloudera-scm-agent/ : agent的配置目录。
/etc/cloudera-scm-server/ : server的配置目录。
/opt/cloudera/parcels/ : Hadoop相关服务安装目录。
/opt/cloudera/parcel-repo/ : 下载的服务软件包数据,数据格式为parcels。
/opt/cloudera/parcel-cache/ : 下载的服务软件包缓存数据。
/etc/hadoop/* : 客户端配置文件目录。

4.2  配置

4.2.1 Hadoop配置文件

    配置文件放置于/var/run/cloudera-scm-agent/process/目录下。如:/var/run/cloudera-scm-agent/process/193-hdfs-NAMENODE/core-site.xml。这些配置文件是通过Cloudera Manager启动相应服务(如HDFS)时生成的,内容从数据库中获得(即通过界面配置的参数)。

    在CM界面上更改配置是不会立即反映到配置文件中,这些信息会存储于数据库中,等下次重启服务时才会生成配置文件。且每次启动时都会产生新的配置文件。

    CM Server主要数据库为scm基中放置配置的数据表为configs。里面包含了服务的配置信息,每一次配置的更改会把当前页面的所有配置内容添加到数据库中,以此保存配置修改历史。

    scm数据库被配置成只能从localhost访问,如果需要从外部连接此数据库,修改vim /var/lib/cloudera-scm-server-db/data/pg_hba.conf文件,之后重启数据库。运行数据库的用户为cloudera-scm。

4.2.2 查看配置内容

    直接查询scm数据库的configs数据表的内容。

    访问REST API: http://hostname:7180/api/v4/cm/deployment,返回JSON格式部署配置信息。

4.2.3 配置生成方式

    CM为每个服务进程生成独立的配置目录(文件)。所有配置统一在服务端查询数据库生成(因为scm数据库只能在localhost下访问)生成配置文件,再由agent通过网络下载包含配置文件的zip包到本地解压到指定的目录。

4.2.4 配置修改

    CM对于需要修改的配置预先定义,对于没有预先定义的配置,则通过在高级配置项中使用xml配置片段的方式进行配置。而对于/etc/hadoop/下的配置文件是客户端的配置,可以在CM通过部署客户端生成客户端配置。

4.3 数据库

    Cloudera manager主要的数据库为scm,存储Cloudera manager运行所需要的信息:配置,主机,用户等。

4.4 CM结构

CM分为Server与Agent两部分及数据库(自带更改过的嵌入Postgresql)。它主要做三件事件:

    1). 管理监控集群主机。

    2). 统一管理配置。

    3). 管理维护Hadoop平台系统。

实现采用C/S结构,Agent为客户端负责执行服务端发来的命令,执行方式一般为使用python调用相应的服务shell脚本。Server端为Java REST服务,提供REST API,Web管理端通过REST API调用Server端功能,Web界面使用富客户端技术(Knockout)。

    1). Server端主体使用Java实现。

    2). Agent端主体使用Python, 服务的启动通过调用相应的shell脚本进行启动,如果启动失败会重复4次调用启动脚本。

    3). Agent与Server保持心跳,使用Thrift RPC框架。

4.5 升级

在CM中可以通过界面向导升级相关服务。升级过程为三步:

    1). 下载服务软件包。

    2). 把所下载的服务软件包分发到集群中受管的机器上。

    3). 安装服务软件包,使用软链接的方式把服务程序目录链接到新安装的软件包目录上。

4.6 卸载

    sudo /usr/share/cmf/uninstall-scm-express.sh, 然后删除/var/lib/cloudera-scm-server-db/目录,不然下次安装可能不成功。

4.7 开启postgresql远程访问

    CM内嵌数据库被配置成只能从localhost访问,如果需要从外部查看数据,数据修改vim /var/lib/cloudera-scm-server-db/data/pg_hba.conf文件,之后重启数据库。运行数据库的用户为cloudera-scm。

4.8 CDH组件的安装目录

 

5.Cloudera Manager 安装部署

    该压缩包一共有2个文档:

    centos7 安装cdh6.0.1&Kerberos:比较新的(公司在用);

    大数据技术之CM:学习用的,版本比较老。

 

6.CDH 5.12.1 自带组件版本

Cluster 1 — CDH 5

主机

hadoop[202-204]

组件

版本

发行版

CDH 版本

Bigtop-Tomcat(仅限 CDH 5)

0.7.0+cdh5.12.1+0

1.cdh5.12.1.p0.3

CDH 5

Crunch(仅限 CDH 5 )

0.11.0+cdh5.12.1+101

1.cdh5.12.1.p0.3

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序员学习圈

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值