📜  OLAP操作

📅  最后修改于: 2020-12-30 00:46:09             🧑  作者: Mango

多维数据模型中的OLAP操作

在多维模型中,记录被组织成多个维度,每个维度都包含由概念层次结构描述的多个抽象级别。该组织为用户提供了从各种角度查看数据的灵活性。存在许多OLAP数据多维数据集操作来演示这些不同的视图,从而允许进行交互式查询和对现有记录的搜索。因此,OLAP支持用于交互式数据分析的用户友好环境。

考虑要在多维数据上执行的OLAP操作。该图显示了商店销售的数据多维数据集。多维数据集包含维度,位置以及时间和项目,其中位置相对于城市值进行汇总,时间相对于季度进行汇总,而项目相对于项目类型进行汇总。

卷起

汇总操作(也称为追溯或聚合操作)通过爬下概念层次结构(即降维)对数据多维数据集执行聚合。汇总就像缩小数据多维数据集。该图显示了在尺寸位置上执行汇总操作的结果。位置的层次结构定义为订购街道,城市,省或州,国家/地区。汇总操作通过将位置层次结构从城市级别提升到国家级别来汇总数据。

通过缩小尺寸进行汇总时,将从多维数据集中删除一个或多个尺寸。例如,考虑一个具有位置和时间两个维度的销售数据多维数据集。可以通过删除时间维度来进行汇总,这些时间维度是按位置(而不是按位置和时间)相对于总销售额的总和。

请考虑以下多维数据集,说明每周记录的某些天的温度:

Temperature 64 65 68 69 70 71 72 75 80 81 83 85
Week1 1 0 1 0 1 0 0 0 0 0 1 0
Week2 0 0 0 1 0 0 1 2 0 1 0 0

考虑一下,我们要根据上述多维数据集设置温度级别(热(80-85),温和(70-75),凉(64-69))。

为此,我们必须对列进行分组并根据概念层次结构将值相加。此操作称为汇总。

通过这样做,我们包含以下多维数据集:

Temperature cool mild hot
Week1 2 1 1
Week2 2 1 1

汇总操作按温度级别对信息进行分组。

下图说明了汇总的工作方式。

下钻

下钻操作(也称为下滚)是上滚的相反操作。向下钻取就像放大数据多维数据集。它从不太详细的记录导航到更详细的数据。向下钻取可以通过为维降低概念层次结构或添加其他维来执行。

该图显示了通过逐步缩小定义为日,月,季度和年的概念层次结构对维度时间执行的向下钻取操作。通过将时间层次结构从四分之一级别降低到一个月的更详细级别,可以进行向下钻取。

因为向下钻取为给定数据添加了更多细节,所以还可以通过向多维数据集添加新维度来执行。例如,可以通过引入其他维度(例如客户群)来对图形的中央多维数据集进行下钻。

向下钻取将更多详细信息添加到给定数据

Temperature cool mild hot
Day 1 0 0 0
Day 2 0 0 0
Day 3 0 0 1
Day 4 0 1 0
Day 5 1 0 0
Day 6 0 0 0
Day 7 1 0 0
Day 8 0 0 0
Day 9 1 0 0
Day 10 0 1 0
Day 11 0 1 0
Day 12 0 1 0
Day 13 0 0 1
Day 14 0 0 0

下图说明了向下钻取的工作方式。

切片是多维数据集的子集,对应于一个或多个维度成员的单个值。例如,当客户想要在产生二维站点的三维立方体的一维上进行选择时,执行切片操作。因此,Slice操作在给定多维数据集的一个维度上执行选择,从而产生一个子多维数据集。

例如,如果我们选择温度= cool,我们将得到以下立方体:

Temperature cool
Day 1 0
Day 2 0
Day 3 0
Day 4 0
Day 5 1
Day 6 1
Day 7 1
Day 8 1
Day 9 1
Day 11 0
Day 12 0
Day 13 0
Day 14 0

下图说明了Slice的工作方式。

在这里,切片使用标准时间=“ Q1”对“时间”维起作用。

通过选择一个或多个尺寸,它将形成一个新的子立方体。

骰子

骰子操作通过在二维或二维上进行选择来描述子多维数据集。

例如,对原始多维数据集实施选择(时间=第3天或时间=第4天)AND(温度=凉或温度=热),我们得到以下子多维数据集(仍为二维)

Temperature cool hot
Day 3 0 1
Day 4 0 0

考虑下图,该图显示了骰子操作。

根据以下选择标准对多维数据集进行骰子操作涉及三个维度。

  • (位置=“多伦多”或“温哥华”)
  • (时间=“ Q1”或“ Q2”)
  • (项目=“移动”或“调制解调器”)

枢轴操作也称为旋转。 Pivot是一种可视化操作,可旋转数据轴以提供数据的替代表示。它可能包含交换行和列,或将行维之一移动到列维中。

考虑下图,该图显示了枢轴操作。

其他OLAP操作

执行包含多个事实表的查询。追溯操作利用关系SQL方便了从数据多维数据集的最底层向下钻取到其后端关系表的操作。

其他OLAP操作可能包含对列表中的前N个或后N个元素进行排名,以及计算移动平均数,增长率和利息,内部收益率,折旧,货币换算和统计任务。

OLAP提供分析建模功能,其中包含一个计算引擎,用于确定比率,方差等以及用于计算各个维度上的度量。它可以在每个粒度级别和每个维交集处生成摘要,聚合和层次结构。 OLAP还提供了用于预测,趋势分析和统计分析的功能模型。在这种情况下,OLAP引擎是功能强大的数据分析工具。