如何设计一套切实可行的数据仓库呢?
我们要明白,对于数据仓库的设计是不能完全依赖于业务的需求,但往往又必须要服务于业务的价值。
因此,在构建数据仓库前,我们往往会通过总线矩阵设计,来快速理解业务并规划数据仓库体系。以求从宏观的角度来描述企业的业务和数据现状,并指导后续的数据仓库建模。
不妨先来看看,祖师爷 Kimball 在书中对总线矩阵的定义:
总线矩阵:提供一种分解企业DW/BI规划任务的合理方式,行是业务过程,列是公共维度(一致性维度),图表中的 X 表示的是哪些列与哪些行有关系,也表示这一个业务过程需要有哪些公共维度。

所以,总线矩阵和一致性维度、一致性事实共同组成了 Kimball 的多维体系结构基础。
在这种多维体系结构(MD) 的数据仓库架构中,主导的思想便是分步建立数据仓库,并由数据集市组合成企业的数据仓库。
但是,在建立第一个数
本文详细介绍了如何设计和构建数据仓库中的总线矩阵,强调其在梳理业务过程、规划数据仓库体系和确保数据一致性方面的重要性。总线矩阵通过业务过程和一致性维度的交叉,为数据架构师提供了清晰的蓝图,并有利于项目规划、主数据管理和团队协作。通过矩阵,可以避免面向需求的开发,保证数据仓库的扩展性和一致性。
订阅专栏 解锁全文


6万+

被折叠的 条评论
为什么被折叠?



