📅  最后修改于: 2020-12-30 00:36:03             🧑  作者: Mango
数据仓库是一种关系数据库管理系统(RDBMS)构造,可以满足事务处理系统的需求。可以粗略地将其描述为可以查询业务收益的任何集中式数据存储库。它是一个数据库,用于存储满足决策要求的信息。它是一组决策支持技术,旨在使知识工作者(执行人员,经理和分析人员)做出更高,更高的决策。因此,数据仓库为业务主管提供了支持体系结构和工具,以系统地组织,理解和使用其信息来制定战略决策。
数据仓库环境包含提取,运输和装载(ETL)解决方案,在线分析处理(OLAP)引擎,客户分析工具以及其他处理收集信息并将其交付给业务用户的过程的应用程序。
数据仓库(DW)是一个关系数据库,旨在进行查询和分析,而不是事务处理。它包括从单个或多个来源的交易数据中得出的历史数据。
数据仓库提供集成的,企业范围的历史数据,并专注于为决策者提供数据建模和分析的支持。
数据仓库是一组特定于整个组织的数据,而不仅仅是特定的一组用户。
它不用于日常操作和交易处理,而是用于决策。
可以将数据仓库视为具有以下属性的数据系统:
“数据仓库是面向主题的,集成的且随时间变化的信息存储,以支持管理层的决策。”
数据仓库的目标是为决策者建模和分析数据。因此,数据仓库通常提供有关特定主题(例如客户,产品或销售)的简洁明了的视图,而不是全局组织的正在进行的操作。这是通过排除对主题无用的数据并包括用户理解主题所需的所有数据来完成的。
数据仓库集成了各种异构数据源,例如RDBMS,平面文件和在线交易记录。它要求在数据仓库期间执行数据清理和集成,以确保不同数据源之间命名约定,属性类型等的一致性。
历史信息保存在数据仓库中。例如,一个人可以检索3个月,6个月,12个月甚至是来自数据仓库的先前数据中的文件。交易系统的这些变化通常只保留最新文件。
数据仓库是物理上独立的数据存储,是从源可操作RDBMS转换而来的。数据仓库中不会发生数据的操作更新,即不执行更新,插入和删除操作。在数据访问中通常只需要两个过程:初始加载数据和访问数据。因此,DW不需要事务处理,恢复和并发功能,从而可以大大加快数据检索的速度。非易失性定义了一旦输入仓库,数据就不应更改。
数据仓库的想法出现在1980年代后期,当时IBM研究人员Barry Devlin和Paul Murphy建立了“业务数据仓库”。
本质上,计划了数据仓库构想以支持用于从操作系统到决策支持环境的信息流的体系结构模型。该概念试图解决与流程相关的各种问题,主要是与流程相关的高成本。
在没有数据仓库体系结构的情况下,需要大量空间来支持多个决策支持环境。在大型公司中,各种决策支持环境独立运行是很平常的。
出于以下原因,需要数据仓库:
在学习数据仓库之前,您必须具有基本数据库概念的基础知识,例如架构,ER模型,结构化查询语言等。
本教程将帮助计算机科学专业的学生理解与数据仓库相关的基础到高级概念。
我们保证您不会在此数据仓库教程中找到任何问题。但是,如果有任何错误,请在联系表格中发布问题。