📅  最后修改于: 2023-12-03 15:10:18.039000             🧑  作者: Mango
数据仓库(Data Warehouse)通常指的是一种大规模的、集成的、主题的、持久的、易变的数据集合,用于支持企业的决策制定,从而实现理解与管理数据的目的。在数据仓库中,术语具有关键的意义,下面是一些常见的术语。
在线事务处理(OLTP)是一种处理实时业务的应用程序。基于 OLTP 的数据库主要用于执行诸如数据插入、更新和删除等交易性操作。OLTP 通常面向数据的正确性和实时性,但是在决策制定和分析方面非常有限。
在线分析处理(OLAP)技术可以更好地支持数据分析与决策制定。OLAP 功能强大,提供丰富的数据分析方式。与 OLTP 不同的是,OLAP致力于数据的汇总、支持复杂分析查询并且经常包含聚合数据。OLAP 不适用于实时数据。
抽取-转化-加载(ETL)指将数据从一个或多个系统中提取然后通过各种数据转换来清洗、转化和组织数据,最后将这些数据加载到目标数据仓库中。 ETL 过程的重要性在于,它对数据仓库中的信息起着至关重要的作用。
尺寸(Dimension)是指描述和标识业务问题所需的事实指标的属性,一般来说,尺寸包含横向指标和纵向指标。常见的纵向尺寸包括时间和位置,而横向测量通常是基于业务实体的描述,例如客户、订单、产品和渠道等。
事实(Fact)是指数据仓库中的具体指标,例如销售额、库存量、销售量、客户数量等。 事实是数据仓库分析的核心,它针对特定的业务过程定义了数量级、维度和衡量标准。
星型模式(Star Schema)是一种使用尺寸表和事实表组成的数据仓库架构。其中,事实表包含事实记录,尺寸表则包含事实记录所需的纵向和横向维度属性。星型模式通常使用 SQL 查询操作,以便从事实记录和维度表中生成报告。
雪花模式(Snowflake Schema)是一种更复杂的数据仓库模式,它是在星型模式的基础上进一步扩展而来的。雪花模式使用多个尺寸表和更多层级的事实表,以实现更丰富更复杂的查询。
以上是一些数据仓库中诸多重要且常用的术语,通过对这些关键术语的了解,程序员可以更好地理解并在自己的代码中运用它们。