📜  OBIEE¢数据仓库

📅  最后修改于: 2020-11-27 07:09:26             🧑  作者: Mango


在当今竞争激烈的市场中,大多数成功的公司都会对市场变化和机遇做出快速反应。快速响应的要求是有效和高效地使用数据和信息。 “DataWarehouseâ€是数据的中央存储库是按类别组织支持organization’的决策者。一旦数据存储在数据仓库中,就可以对其进行分析。

“数据仓库”一词最早是由比尔·英蒙(Bill Inmon)在1990年提出的。据他所说,“数据仓库是面向主题的,集成的,时变的和非易失性的数据收集,用于支持管理层的决策过程。”欧元

Ralph Kimball根据其功能提供了数据仓库的定义。他说:“数据仓库是专门为查询和分析而构造的交易数据的副本。”

数据仓库(DW或DWH)是用于数据分析和报告目的的系统。它们是存储来自一个或多个异构数据源的数据的存储库。它们存储当前和历史数据,并用于创建分析报告。 DW可用于为高级管理层创建交互式仪表板。

例如,分析报告可以包含用于公司的销售报告的季度比较或年度比较的数据。

DW中的数据来自多个操作系统,例如销售,人力资源,市场营销,仓库管理等。它包含来自不同交易系统的历史数据,但也可以包含来自其他来源的数据。 DW用于将数据处理和分析工作负载与事务工作负载分开,并能够合并来自多个数据源的数据。

数据仓库的需求

例如-您有一个房屋贷款代理,其数据来自多个SAP /非SAP应用程序,例如市场营销,销售,ERP,HRM等。这些数据被提取,转换并加载到DW中。如果必须对产品进行季度/年度销售比较,则不能使用运营数据库,因为这会挂起交易系统。这就是使用DW的需求所在。

数据仓库的特征

DW的一些关键特征是-

  • 它用于报告和数据分析。
  • 它提供了一个中央存储库,其中集成了来自一个或多个源的数据。
  • 它存储当前和历史数据。

数据仓库与交易系统

以下是数据仓库和操作数据库(事务系统)之间的一些区别-

  • 事务系统是为已知的工作负载和事务而设计的,例如更新用户记录,搜索记录等。但是,DW事务更复杂,并且呈现数据的一般形式。

  • 交易系统包含组织的当前数据,而DW通常包含历史数据。

  • 交易系统支持并行处理多个交易。需要并发控制和恢复机制来维护数据库的一致性。

  • 操作数据库查询允许读取和修改操作(删除和更新),而OLAP查询仅需要对存储的数据进行只读访问(选择语句)。

  • DW涉及数据清理,数据集成和数据合并。

DW具有三层体系结构-数据源层,集成层和表示层。下图显示了数据仓库系统的通用体系结构。

数据仓库架构

数据仓库系统的类型

以下是DW系统的类型-

  • 数据库
  • 在线分析处理(OLAP)
  • 在线交易处理(OLTP)
  • 预测分析

数据库

数据集市是DW的最简单形式,通常集中于单个功能区域,例如销售,财务或市场营销。因此,数据集市通常仅从很少的数据源获取数据。

源可以是内部交易系统,中央数据仓库或外部数据源应用程序。去标准化是该系统中数据建模技术的规范。

数据库

在线分析处理(OLAP)

OLAP系统包含较少的事务数,但是涉及复杂的计算,例如使用汇总-总和,计数,平均值等。

什么是汇总?

我们保存具有汇总数据的表,例如每年(1行),每季度(4行),每月(12行),现在我们想比较数据,例如每年仅处理1行。但是,在未聚合的数据中,将处理所有行。

OLAP系统通常将数据存储在诸如Star Schema,Galaxy Schema之类的多维模式中(事实表和Dimensional表以逻辑方式连接在一起)。

在OLAP系统中,执行查询的响应时间是一种有效性度量。数据挖掘技术广泛使用OLAP应用程序从OLAP系统获取数据。 OLAP数据库以多维模式存储汇总的历史数据。 OLAP系统的数据延迟为几个小时,而Data Marts的延迟通常通常为几天。

在线交易处理(OLTP)

OLTP系统以大量的短时在线事务(例如插入,更新,删除等)而闻名。OLTP系统提供快速的查询处理,并且还负责在多址访问环境中提供数据完整性。

对于OLTP系统,有效性是通过每秒处理的事务数来衡量的。 OLTP系统通常仅包含当前数据。用于存储事务数据库的架构是实体模型。归一化用于OLTP系统中的数据建模技术。

OLTP与OLAP

下图显示了OLTP和OLAP系统之间的主要区别。

OLTP与OLAP

索引-在OLTP系统中,只有很少的索引,而在OLAP系统中,有许多用于性能优化的索引。

联接-在OLTP系统中,大量联接和数据被规范化;但是,在OLAP系统中,联接和反规范化较少。

聚合-在OLTP系统中,不聚合数据,而在OLAP数据库中使用更多聚合。