📜  数据仓库什么是维建模

📅  最后修改于: 2020-12-30 00:49:02             🧑  作者: Mango

什么是尺寸建模?

维建模使用多维数据集操作表示数据,使用OLAP数据管理可以使逻辑数据表示更合适。维度建模的感知是由Ralph Kimball开发的,它由“事实”“维度”表组成。

在维建模中,交易记录分为“事实”(通常是数字交易数据)或“维度”(它们是为事实提供上下文的参考信息)。例如,销售交易可能会损害事实,例如订购的产品数量和产品价格,以及损害尺寸,例如订购日期,用户名,产品编号,订单运送至和开单地点,并负责接收订单的业务员。

尺寸建模的目标

尺寸建模的目的是:

  • 生成易于最终客户理解和编写查询的数据库体系结构。
  • 最大限度地提高查询效率。它通过最小化表的数量以及它们之间的关系来实现这些目标。

尺寸建模的优点

以下是维建模的好处:

尺寸建模很简单:尺寸建模方法使仓库设计人员可以创建业务客户可以轻松掌握和理解的数据库架构。无需对如何阅读图表进行大量培训,并且不同数据元素之间没有复杂的关系。

维度建模可提高数据质量:星型模式使仓库管理员可以对数据仓库执行参照完整性检查。由于事实信息密钥是其相关维度的要旨的串联,因此,如果适当描述了相应的维度记录并且该事实记录也存在于数据库中,则会主动加载事实记录。

通过强制使用外键约束作为参照完整性检查的一种形式,数据仓库DBA可以增加针对损坏的仓库数据的防护线。

通过聚合可以实现性能优化:随着数据仓库规模的增加,性能优化已成为紧迫的问题。必须等待几个小时才能得到查询答复的客户很快就会对仓库不满。聚合是可以优化查询性能的最简单方法之一。

尺寸建模的缺点

  • 为了保持事实和维度的完整性,向数据仓库加载来自各种操作系统的记录非常复杂。
  • 如果采用维度技术的组织更改其开展业务的方法,那么修改数据仓库的操作将变得非常重要。

尺寸建模要素

事实

它是由度量和上下文数据组成的关联数据项的集合。它通常代表业务项目或业务交易。

外型尺寸

它是描述一个业务维度的数据的集合。维度决定事实的上下文背景,它们是执行OLAP的框架。

测量

它是事实的数字属性,代表业务相对于维度的绩效或行为。

考虑到关系上下文,在维度建模中使用了两个基本模型:

  • 明星模特
  • 雪花模型

星形模型是维模型的基础结构。它有一个宽大的中央桌子(事实桌子)和一组较小的桌子(尺寸),这些桌子以径向设计围绕主桌子排列。雪花模型是分解一个或多个维度的结论。

事实表

事实表用于记录业务中的事实或度量。事实是公司感兴趣的数字数据元素。

事实表的特征

事实表包括我们测量的数值。例如,事实值20可能意味着已售出20个小部件。

每个事实表都包括关联维表的键。这些在事实表中称为外键。

事实表通常包括少量列。

与维表进行比较时,事实表具有大量的行。

尺寸表

维度表建立了事实的上下文。维表存储描述事实的字段。

尺寸表的特征

维度表包含有关事实的详细信息。举例来说,这使业务分析师能够更好地理解数据及其报告。

维度表包括有关事实表中数值的描述性数据。也就是说,它们包含事实的属性。例如,用于营销分析函数的维度表可能包括诸如时间,营销区域和产品类型之类的属性。

由于维表中的记录是非规范化的,因此它通常具有大量的列。维度表所包含的信息行比事实表少得多。

维度表中的属性用作文档或查询结果显示中的行标题和列标题。

示例:城市和州可以在事实表中查看商店摘要。可以按品牌,颜色等查看项目摘要。可以按名称和地址查看客户信息。

事实表

Time ID Product ID Customer ID Unit Sold
4 17 2 1
8 21 3 2
8 4 1 1

在此示例中,事实表中的“客户ID”列是与维表结合的外键。通过链接,我们可以看到事实表的第2行记录了这样一个事实,即客户3 Gaurav在第8天购买了两个商品。

尺寸表

Customer ID Name Gender Income Education Region
1 Rohan Male 2 3 4
2 Sandeep Male 3 5 1
3 Gaurav Male 1 7 3

层次结构

层次结构是一棵有向树,其节点是尺寸属性,并且其弧模型对尺寸属性组之间的多对一关联进行建模。它包含一个定位在树的根处的维,以及定义该维的所有维属性。