📅  最后修改于: 2023-12-03 15:32:28.484000             🧑  作者: Mango
Ralph Kimball 和 Bill Inmon 都是数据仓库领域的专家,在数据仓库的设计和实现方面有很大的影响力。虽然他们共同关注于数据仓库,但是他们在数据仓库的设计和方法上有很大的差异。
Kimball 方法更加注重数据仓库的维度建模(dimensional modeling),也称星型模型(star schema)。在 Kimball 方法中,量度(facts)是数据仓库中最重要的部分,每个量度都有一组与其关联的维度。维度包含描述量度特征的属性(attributes)。
Kimball 方法还认为数据仓库必须是商业用户可以方便理解和查询的,因此,Kimball 提倡采用企业数据总线(bus) 的方法,通过将组成商业过程的事实和维度,构造出一个企业级的逻辑数据模型,以达到最终商业用户和数据仓库设计人员之间最广泛、最一致的数据共享。
Inmon 方法更加注重数据仓库的标准化、一致性和规范化。在 Inmon 方法中,数据仓库是基于对现有系统中所有数据进行整合,创建一个统一的数据存储库设计的,称之为“企业数据仓库(Enterprise data warehouse,EDW)”。数据存储库可以包括许多基于宏观或微观企业的主题区域模型主题,有时也称为“唯一的数据源(Single source of truth)”。
Inmon 方法着重于以下原则:数据一致性、数据集成、基本数据架构、总体明确数据标准、全面数据审计、对数据进行“正确性、完整性、可靠性”的保障等方面的工作。
Kimball 方法侧重于维度建模,追求商业用户易于理解和利用。Inmon 方法更侧重于创建一个“企业数据仓库”,强调数据的一致性、唯一性和规范化。
Kimball 和 Inmon 方法各有优势,应根据企业自身业务和发展阶段考虑使用哪种方法来创建数据仓库。
对于数据仓库开发人员来说,了解这两种不同的方法有利于根据具体情况选择最佳的设计方法。
参考链接: