先决条件 – 大数据简介,大数据的好处
星型模式是数据集市模式中的基础模式,也是最简单的模式。此模式广泛用于开发或构建数据仓库和维度数据集市。它包括一个或多个索引任意数量维表的事实表。星型模式是雪花模式的必要原因。它对于处理基本查询也很有效。
据说它是星形的,因为它的物理模型类似于星形,在其中心有一个事实表,在其外围有代表星点的维度表。下面是一个演示 Star Schema 的示例:
在上面的演示中,SALES 是一个事实表,具有引用维度表的属性,即(产品 ID、订单 ID、客户 ID、雇主 ID、总计、数量、折扣)。员工维度表包含属性:Emp ID、Emp Name、Title、Department 和 Region。产品维度表包含以下属性:产品 ID、产品名称、产品类别、单价。客户维度表包含以下属性:客户 ID、客户名称、地址、城市、邮编。时间维度表包含以下属性:订单 ID、订单日期、年、季度、月。
星型模式模型:
在 Star Schema 中,包含业务定量数据的业务流程数据分布在事实表和维度中,这些维度是与事实数据相关的描述性特征。销售价格、销售数量、距离、速度、重量和重量测量是星型模式中事实数据的几个例子。
通常,具有多个维度的星型模式被称为蜈蚣模式。处理具有很少属性维度的星型模式很容易。
星型架构的优点:
- 更简单的查询 –
与从高度规范化的事务模式中获取数据所需的其他连接逻辑相比,星型模式的连接逻辑非常简单。 - 简化的业务报告逻辑 –
与高度规范化的事务模式相比,星型模式使常见的业务报告逻辑更简单,例如截至报告和期间报告。 - 喂食方块 –
所有 OLAP 系统都广泛使用星型模式来高效地设计 OLAP 多维数据集。事实上,主要的 OLAP 系统提供了一种 ROLAP 操作模式,它可以使用星型模式作为源,而无需设计多维数据集结构。
星型架构的缺点 –
- 由于处于高度非规范化的模式状态,因此无法很好地执行数据完整性。
- 如果分析需要作为规范化数据模型,则不灵活。
- 星型模式不会加强业务实体内的多对多关系——至少不会经常出现。