📅  最后修改于: 2021-01-07 05:56:21             🧑  作者: Mango
在线分析处理服务器(OLAP)基于多维数据模型。它使管理人员和分析人员可以通过快速,一致和交互式的信息访问来洞察信息。本章介绍OLAP的类型,对OLAP的操作,OLAP之间的差异以及统计数据库和OLTP。
我们有四种类型的OLAP服务器-
ROLAP服务器位于关系后端服务器和客户端前端工具之间。为了存储和管理仓库数据,ROLAP使用关系或扩展关系DBMS。
ROLAP包括以下内容-
MOLAP使用基于数组的多维存储引擎来获取数据的多维视图。对于多维数据存储,如果数据集稀疏,则存储利用率可能较低。因此,许多MOLAP服务器使用两个级别的数据存储表示来处理密集和稀疏的数据集。
混合OLAP是ROLAP和MOLAP的组合。它提供了更高的ROLAP可伸缩性和更快的MOLAP计算能力。 HOLAP服务器允许存储大量数据的详细信息。聚合分别存储在MOLAP存储中。
专门的SQL服务器为只读环境中的星型和雪花模式的SQL查询提供高级查询语言和查询处理支持。
由于OLAP服务器基于数据的多维视图,因此我们将讨论多维数据中的OLAP操作。
这是OLAP操作的列表-
汇总通过以下任何一种方式对数据多维数据集执行聚合-
下图说明了汇总的工作方式。
汇总是通过爬升维度位置的概念层次结构来执行的。
最初,概念层次是“街道<城市<省<国家”。
汇总时,通过将位置层次结构从城市级别提升到国家级别来汇总数据。
数据分为城市而不是国家。
执行汇总时,将从数据多维数据集中删除一个或多个维度。
下钻是上滚的相反操作。它可以通过以下两种方式之一执行-
下图说明了向下钻取的工作方式-
通过在维度时间上降低概念层次结构来执行向下钻取。
最初,概念层次结构是“天<月<季度&年”。
在向下钻取时,时间维度从四分之一级别下降到一个月级别。
执行向下钻取时,将添加数据多维数据集中的一个或多个维度。
它将数据从不太详细的数据导航到高度详细的数据。
切片操作从给定的多维数据集中选择一个特定的维度,并提供一个新的子多维数据集。请考虑下图,该图显示了切片的工作原理。
在此使用标准时间=“ Q1”对维“时间”执行切片。
通过选择一个或多个维度,它将形成一个新的子多维数据集。
Dice从给定的多维数据集中选择两个或多个维,并提供一个新的子多维数据集。考虑以下显示骰子操作的图。
根据以下选择标准对多维数据集进行骰子操作涉及三个维度。
枢轴操作也称为旋转。它在视图中旋转数据轴,以提供替代的数据表示方式。考虑下图,该图显示了枢轴操作。
Sr.No. | Data Warehouse (OLAP) | Operational Database (OLTP) |
---|---|---|
1 | Involves historical processing of information. | Involves day-to-day processing. |
2 | OLAP systems are used by knowledge workers such as executives, managers and analysts. | OLTP systems are used by clerks, DBAs, or database professionals. |
3 | Useful in analyzing the business. | Useful in running the business. |
4 | It focuses on Information out. | It focuses on Data in. |
5 | Based on Star Schema, Snowflake, Schema and Fact Constellation Schema. | Based on Entity Relationship Model. |
6 | Contains historical data. | Contains current data. |
7 | Provides summarized and consolidated data. | Provides primitive and highly detailed data. |
8 | Provides summarized and multidimensional view of data. | Provides detailed and flat relational view of data. |
9 | Number or users is in hundreds. | Number of users is in thousands. |
10 | Number of records accessed is in millions. | Number of records accessed is in tens. |
11 | Database size is from 100 GB to 1 TB | Database size is from 100 MB to 1 GB. |
12 | Highly flexible. | Provides high performance. |