设计数据仓库是业务发展的重要组成部分。在设计方面,有两种最常见的架构,名为Kimball和Inmon,但问题是哪个更好,哪个以低冗余为用户服务。让我们在一些因素上比较两者。
1. 金博尔:
Ralph Kimball介绍了设计 Dataware 房屋的 Kimball 方法。这种方法从识别 Dataware 公司必须回答的业务流程和问题开始。这些信息集正在被分析,然后被很好地记录下来。提取转换加载 (ETL) 软件从称为数据集市的多个数据源中提取所有数据,然后将其加载到称为暂存的公共区域。然后将其转换为 OLAP 多维数据集。
应用:
- 设置和构建很快。
- 针对多星模式生成报告非常成功。
- 数据库操作非常有效。
- 占用数据库空间小,管理方便。
Kimball Dataware 房屋架构如下图所示:
2. 内蒙:
设计 Dataware 房屋的 Inmon 方法是由Bill Inmon引入的。这种方法从企业数据模型开始。该模型识别关键领域,并照顾客户、产品和供应商。该模型用于创建用于主要操作的详细逻辑模型。详细信息,然后使用模型来开发物理模型。该模型经过规范化,减少了数据冗余。这是一个复杂的模型,很难用于创建数据集市并且每个部门都可以将其用于其目的的业务目的。
应用:
- 数据仓库对变化非常灵活。
- 业务流程很容易理解。
- 可以跨企业处理报告。
- ETL 过程非常不容易出错。
Inmon Dataware 内部架构如下图所示:
Kimball 和 Inmon 的区别:
Parameters | Kimball | Inmon |
---|---|---|
Introduced by | Introduced by Ralph Kimball. | Introduced by Bill Inmon. |
Approach | It has Bottom-Up Approach for implementation. | It has Top-Down Approach for implementation. |
Data Integration | It focuses Individual business areas. | It focuses Enterprise-wide areas. |
Building Time | It is efficient and takes less time. | It is complex and consumes a lot of time. |
Cost | It has iterative steps and is cost effective. | Initial cost is huge and development cost is low. |
Skills Required | It does not need such skills but a generic team will do job. | It needs specialized skills to make work. |
Maintenance | Here maintenance is difficult. | Here maintenance is easy. |
Data Model | It prefers data to be in De-normalized model. | It prefers data to be in normalized model. |
Data Store Systems | In this, source systems are highly stable. | In this, source systems have high rate of change. |