CMDB 系统:为什么大多数企业建了又废掉,以及怎么才能真正用起来

IT 圈里有个说法:CMDB 是"最难落地的系统"之一。

不是因为技术复杂,而是因为大多数企业建 CMDB 的方式从一开始就错了——花几个月把数据录进去,然后发现数据两周后就开始过期,三个月后已经严重失真,最后变成一个没人相信、没人维护、形同虚设的数据库。

我见过不止一家公司在 CMDB 上砸了钱又放弃,问题不在工具,在于根本没搞清楚 CMDB 是什么、该怎么用。这篇文章就来把这件事说清楚。

一、CMDB 到底是什么:不是数据库,是关系图谱

CMDB 的全称是配置管理数据库(Configuration Management Database),听起来很技术,但核心思想其实很朴素:记录 IT 环境中所有重要的"东西",以及这些"东西"之间的关系。

这里的"东西"在 ITIL 框架里有个正式名字叫配置项(Configuration Item,CI),范围非常广:服务器、网络设备、存储、虚拟机、容器、操作系统、数据库、应用程序、软件许可证,甚至文档、合同都可以是配置项。

但 CMDB 真正的价值,不在于记录这些配置项本身,而在于记录它们之间的关联关系。一台数据库服务器,如果只是记录"它存在、它的 IP 是什么、它的内存是多少",这是资产台账,不是 CMDB。CMDB 要记录的是:这台数据库服务器上跑着三个数据库实例,这三个实例分别被哪些应用访问,这些应用部署在哪些服务器上,对应的业务是什么,业务的负责人是谁。这张关系图,才是 CMDB 的核心价值所在。

很多人容易把 CMDB 和 IT 资产管理(ITAM)混为一谈。简单区分:IT 资产管理关注的是资产的财务和生命周期——这台服务器多少钱买的、什么时候保修到期、现在在哪里;CMDB 关注的是配置项的技术状态和相互关系——这台服务器现在跑着什么、跟哪些系统有依赖。两者互补,但不能互相替代。

二、CMDB 的数据从哪里来:自动化扫描是根本

很多企业建了 CMDB,但数据很快就过时,因为全靠人工录入。IT 资产天天在变——新买了设备、旧设备报废了、服务器上装了新软件——这些变化很难依靠人工保持同步。靠人工维护的 CMDB,数据的准确性往往在三个月内就开始明显衰减,数据一旦不可信,就没人愿意查,也没人愿意更新,陷入恶性循环。

打破这个循环的唯一办法,是自动化采集。下面这张图展示了 CMDB 数据从采集到使用的完整链路:从网络扫描、域扫描、分布式扫描、条形码/二维码等多种方式自动发现资产,到构建资产清单、做资产与用户的映射、管理软件资产合规,再到构建配置项(CI)之间的关系,最后支撑事件管理、变更管理、项目管理等其它 IT 流程。整个链路里,资产状态的更新还能自动触发通知。

从自动化扫描发现资产,到构建配置项关系,再到支撑其它 IT 流程——CMDB 数据的完整链路

这张图里有两个关键环节值得强调。一是最左侧的"扫描":自动化的资产发现是 CMDB 数据保持鲜活的源头,它还能发现"影子 IT"——员工私自接入的设备或绕过 IT 自行部署的软件。二是第 5 步的"构建 CI 关系":这是 CMDB 区别于普通资产台账的核心,把孤立的配置项连成有依赖关系的图谱,后面的所有价值都建立在这个关系网之上。

三、CMDB 怎么用:变更影响评估是最直接的价值场景

抽象地说 CMDB 的价值没有意义,直接看一个最常见的场景:变更影响评估。

IT 工程师计划对某台核心服务器做维护升级,需要停机。在动手之前,他需要知道:这台服务器停了,会影响哪些应用?这些应用对应哪些业务?哪些部门会受到影响?最合适的维护时间窗口是什么?

没有 CMDB,这个评估只能靠工程师的记忆和经验,或者逐个去问相关系统的负责人,耗时费力还容易遗漏关键依赖。有了准确的 CMDB,从这台服务器出发,顺着配置项的关系图谱往下查,受影响的应用、业务、团队一目了然,几分钟就能完成影响分析。

这个价值,在变更管理流程里体现得最清楚。下面是一个标准的变更管理流程:从新建变更(可以直接从事件或问题工单创建),到提交、计划、审批、公告通知、实施、实施后审验,最后关闭变更。其中第 3 步"计划"阶段,核心工作之一就是影响分析——而高质量的影响分析,正是依赖 CMDB 提供的配置项关系数据。

变更管理流程的"计划"阶段需要做影响分析,这一步高度依赖 CMDB 的配置项关系数据

CMDB 和变更管理的这种联动,是 CMDB 价值释放的典型方式。同样地,当一个重大事件发生时,事件管理团队也可以调用 CMDB 的关联关系,快速定位受影响的配置项、找到负责人,大幅缩短故障定位时间;问题管理做根因分析时,CMDB 里记录的配置项变更历史也是重要线索。CMDB 不是一个独立存在的数据库,它的价值在和 ITSM 各个流程的深度集成中才能充分释放。

四、CMDB 为什么总是建了又废掉

说到这里,CMDB 的价值听起来很美好。那为什么落地失败率这么高?原因我归纳了几个,几乎每家失败的企业都中了其中几条。

第一,靠人工录入维护数据,注定失败。前面已经说过,IT 环境是活的,人工维护跟不上变化的速度。解决方案是自动化采集,把人工维护的比例压到最低,这是 CMDB 能持续可信的前提。

第二,范围定得太大,什么都想录进去。有些团队雄心勃勃,想把公司所有 IT 资产、所有关系全部录进去,结果建库工作永远做不完,还没建好数据已经开始过期。正确的做法是从核心系统开始,先把最关键的配置项和关系梳理清楚,让 CMDB 在核心场景里真正发挥价值,再逐步扩展。完美是可用性的敌人,先用起来比先做完整更重要。

第三,CMDB 和业务流程脱节,没有使用场景。建了 CMDB 但没有跟变更管理、事件管理、问题管理集成,工程师在日常工作中根本不需要打开它,自然也不会去维护。CMDB 要有人用,就要嵌入到日常工作流程中——做变更评估时必须查 CMDB,处理事件时从 CMDB 里找关联关系,这样数据的准确性才会被持续关注。

第四,配置项之间的关系比配置项本身更难维护。很多团队把配置项录进去了,但关系梳理不清楚,或者关系随着系统变化没有及时更新。没有准确关系的 CMDB,就像一张只有节点没有连线的地图,大部分价值无从实现。关系的维护需要结合自动化工具(比如通过流量分析发现应用间的调用关系)和人工梳理(由了解架构的人定期 review),两者结合才能保持准确。

五、建 CMDB 的正确姿势

基于前面说的那些坑,反过来就是正确路径。

从自动化采集开始,而不是从手工录入开始。规划 CMDB 项目时,第一件事不是设计表单让工程师填数据,而是评估现有环境能用什么方式自动采集配置信息:有没有现成的网络扫描工具?服务器上能不能部署采集 Agent?云资源能不能通过 API 同步?把自动化采集的覆盖率提上去,才有维持数据鲜活的基础。

先定义核心配置项和关键关系,不求大求全。梳理出公司最核心的十到二十个业务系统,把这些系统涉及的配置项和依赖关系作为第一期范围,集中资源先把这部分做准确,让 CMDB 在最关键的场景里能用起来,再逐步扩展。

让 CMDB 和 ITSM 流程强绑定。在变更申请流程中,要求工程师填写受影响的配置项,系统自动从 CMDB 拉取关联关系供评估;在事件处理流程中,工单和相关配置项关联,方便快速定位。把 CMDB 嵌入日常流程,才能让它真正被用起来。

定期做配置审计,发现并修复数据偏差。即使有自动化采集,也难免有遗漏和偏差。定期把 CMDB 中的数据和实际环境做对比,发现差异及时修正,同时找出差异的来源、优化采集流程。数据质量是 CMDB 的生命线,需要持续投入维护。

CMDB 不是买一套软件就能解决的问题,也不是一次性的项目,它是一个需要持续运营的能力体系。做好了,它是 IT 运维、变更管理、安全响应、合规审计的共同基础;做不好,它就是一个浪费资源的数据垃圾场。

如果你正在考虑建设或重建 CMDB,本文展示的资产发现链路与变更流程,来自 ManageEngine 的 ServiceDesk Plus。它提供了与 ITSM 流程原生集成的 CMDB 模块,支持多种方式的自动化资产扫描、配置项关系可视化,变更管理、事件管理流程可以直接调用 CMDB 数据做影响分析,不需要在多个独立系统之间手动同步。对于想把 CMDB 真正用起来、而不只是建起来的团队,值得作为选型时的参考。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值