📜  数据仓库-OLAP

📅  最后修改于: 2021-01-07 05:56:21             🧑  作者: Mango


在线分析处理服务器(OLAP)基于多维数据模型。它使管理人员和分析人员可以通过快速,一致和交互式的信息访问来洞察信息。本章介绍OLAP的类型,对OLAP的操作,OLAP之间的差异以及统计数据库和OLTP。

OLAP服务器的类型

我们有四种类型的OLAP服务器-

  • 关系OLAP(ROLAP)
  • 多维OLAP(MOLAP)
  • 混合OLAP(HOLAP)
  • 专用SQL Server

关系OLAP

ROLAP服务器位于关系后端服务器和客户端前端工具之间。为了存储和管理仓库数据,ROLAP使用关系或扩展关系DBMS。

ROLAP包括以下内容-

  • 聚合导航逻辑的实现。
  • 针对每个DBMS后端的优化。
  • 其他工具和服务。

多维OLAP

MOLAP使用基于数组的多维存储引擎来获取数据的多维视图。对于多维数据存储,如果数据集稀疏,则存储利用率可能较低。因此,许多MOLAP服务器使用两个级别的数据存储表示来处理密集和稀疏的数据集。

混合OLAP

混合OLAP是ROLAP和MOLAP的组合。它提供了更高的ROLAP可伸缩性和更快的MOLAP计算能力。 HOLAP服务器允许存储大量数据的详细信息。聚合分别存储在MOLAP存储中。

专用SQL Server

专门的SQL服务器为只读环境中的星型和雪花模式的SQL查询提供高级查询语言和查询处理支持。

OLAP操作

由于OLAP服务器基于数据的多维视图,因此我们将讨论多维数据中的OLAP操作。

这是OLAP操作的列表-

  • 卷起
  • 下钻
  • 切片切丁
  • 枢轴旋转

卷起

汇总通过以下任何一种方式对数据多维数据集执行聚合-

  • 通过为维度爬升概念层次结构
  • 通过减少尺寸

下图说明了汇总的工作方式。

卷起

  • 汇总是通过爬升维度位置的概念层次结构来执行的。

  • 最初,概念层次是“街道<城市<省<国家”。

  • 汇总时,通过将位置层次结构从城市级别提升到国家级别来汇总数据。

  • 数据分为城市而不是国家。

  • 执行汇总时,将从数据多维数据集中删除一个或多个维度。

下钻

下钻是上滚的相反操作。它可以通过以下两种方式之一执行-

  • 通过降低维度的概念层次结构
  • 通过引入新的维度。

下图说明了向下钻取的工作方式-

下钻

  • 通过在维度时间上降低概念层次结构来执行向下钻取。

  • 最初,概念层次结构是“天<月<季度&年”。

  • 在向下钻取时,时间维度从四分之一级别下降到一个月级别。

  • 执行向下钻取时,将添加数据多维数据集中的一个或多个维度。

  • 它将数据从不太详细的数据导航到高度详细的数据。

切片操作从给定的多维数据集中选择一个特定的维度,并提供一个新的子多维数据集。请考虑下图,该图显示了切片的工作原理。

片

  • 在此使用标准时间=“ Q1”对维“时间”执行切片。

  • 通过选择一个或多个维度,它将形成一个新的子多维数据集。

骰子

Dice从给定的多维数据集中选择两个或多个维,并提供一个新的子多维数据集。考虑以下显示骰子操作的图。

骰子

根据以下选择标准对多维数据集进行骰子操作涉及三个维度。

  • (位置=“多伦多”或“温哥华”)
  • (时间=“ Q1”或“ Q2”)
  • (项目=“移动”或“调制解调器”)

枢轴操作也称为旋转。它在视图中旋转数据轴,以提供替代的数据表示方式。考虑下图,该图显示了枢轴操作。

枢

OLAP与OLTP

Sr.No. Data Warehouse (OLAP) Operational Database (OLTP)
1 Involves historical processing of information. Involves day-to-day processing.
2 OLAP systems are used by knowledge workers such as executives, managers and analysts. OLTP systems are used by clerks, DBAs, or database professionals.
3 Useful in analyzing the business. Useful in running the business.
4 It focuses on Information out. It focuses on Data in.
5 Based on Star Schema, Snowflake, Schema and Fact Constellation Schema. Based on Entity Relationship Model.
6 Contains historical data. Contains current data.
7 Provides summarized and consolidated data. Provides primitive and highly detailed data.
8 Provides summarized and multidimensional view of data. Provides detailed and flat relational view of data.
9 Number or users is in hundreds. Number of users is in thousands.
10 Number of records accessed is in millions. Number of records accessed is in tens.
11 Database size is from 100 GB to 1 TB Database size is from 100 MB to 1 GB.
12 Highly flexible. Provides high performance.