📝 数据仓库(Data Warehouse)
31篇技术文档📅  最后修改于: 2020-12-30 00:29:10        🧑  作者: Mango
数据仓库教程数据仓库是一种关系数据库管理系统(RDBMS)构造,可以满足事务处理系统的需求。可以粗略地将其描述为可以查询业务收益的任何集中式数据存储库。它是一个数据库,用于存储满足决策要求的信息。它是一组决策支持技术,旨在使知识工作者(执行人员,经理和分析人员)做出更高,更高的决策。因此,数据仓库为业务主管提供了支持体系结构和工具,以系统地组织,理解和使用其信息来制定战略决策。数据仓库环境包含提取...
📅  最后修改于: 2020-12-30 00:30:09        🧑  作者: Mango
数据仓库的组件或构建块建筑是元素的正确布置。我们建立一个包含软件和硬件组件的数据仓库。为了适应我们组织的要求,我们安排了这些建筑,我们可能希望通过额外的工具和服务来提高其他水平。所有这些都取决于我们的情况。该图显示了典型仓库的基本要素。我们看到“源数据”组件显示在左侧。数据登台元素用作下一个构建块。在中间,我们看到了处理数据仓库数据的数据存储组件。该元素不仅存储和管理数据,而且还存储和管理数据。它...
📅  最后修改于: 2020-12-30 00:31:05        🧑  作者: Mango
运营数据库和数据仓库之间的区别操作数据库是数据仓库的信息源。它包含用于运行企业日常运营的详细信息。随着更新的进行,数据会经常更改,并反映最近交易的当前值。运营数据库管理系统也称为OLTP(在线交易处理数据库),用于实时管理动态数据。数据仓库系统为用户或知识工作者服务,以进行数据分析和决策。这样的系统可以以特定格式组织和呈现信息,以适应各种用户的多样化需求。这些系统称为在线分析处理(OLAP)系统。...
📅  最后修改于: 2020-12-30 00:32:04        🧑  作者: Mango
数据仓库架构数据仓库体系结构是一种定义数据通信处理和表示的整体体系结构的方法,该体系结构存在于企业中的最终客户端计算中。每个数据仓库都是不同的,但是都具有标准的关键组件。生产应用程序(如工资核算,应付账款产品购买和库存控制)设计用于在线交易处理(OLTP)。这样的应用程序每天收集详细的数据。数据仓库应用程序旨在支持用户临时数据要求,该活动最近被称为在线分析处理(OLAP)。这些包括诸如预测,分析,...
📅  最后修改于: 2020-12-30 00:32:59        🧑  作者: Mango
三层数据仓库架构数据仓库通常具有三级(层)架构,其中包括:底层(数据仓库服务器)中间层(OLAP服务器)顶层(前端工具)。由Data Warehouse服务器组成的底层,该服务器几乎总是RDBMS。它可能包括几个专门的数据集市和一个元数据存储库。使用称为网关的应用程序接口提取来自运营数据库和外部源的数据(例如外部顾问提供的用户配置文件数据)。底层DBMS提供了一个网关,该网关允许客户程序生成要在服...
📅  最后修改于: 2020-12-30 00:33:55        🧑  作者: Mango
什么是运营数据存储?ODS被Inmon和Imhoff(1996)描述为面向主题的,集成的,易变的,当前值的数据存储,仅包含详细的公司数据。数据仓库是一个文档数据库,其中包括相关的最近以及历史信息,还可能包含汇总数据。ODS是面向主题的。它围绕企业的重要信息主题进行组织。在大学中,主题可能是学生,讲师和课程,而在公司中,主题可能是用户,销售人员和产品。ODS是集成的。也就是说,它是来自各种系统的一组...
📅  最后修改于: 2020-12-30 00:34:49        🧑  作者: Mango
ETL(提取,转换和加载)过程什么是ETL?从源系统提取信息并将其带入数据仓库的机制通常称为ETL,它代表提取,转换和加载。ETL流程需要各个利益相关者的积极投入,包括开发人员,分析师,测试人员,高层管理人员,并且在技术上存在挑战。为了保持其作为决策者工具的价值,数据仓库技术需要随着业务变化而变化。 ETL是数据仓库系统的一种重复使用的方法(每天,每周,每月),并且需要灵活,自动化并且有据可查。E...
📅  最后修改于: 2020-12-30 00:35:45        🧑  作者: Mango
ETL和ELT之间的区别ETL(提取,转换和加载)提取,转换和加载是从记录源(存在于外部或内部等)中提取记录到暂存区域,然后对其进行业务处理以进行转换或重新格式化以满足业务需求的技术。数据分析,然后再加载到目标数据库或目标数据库或数据仓库中。长处开发时间:从输出向后的设计提供仅提取和处理适用于解决方案的信息,从而可能减少开发,删除和处理开销。目标数据:由于装载过程的目标功能,仓库仅包含与展示有关的...
📅  最后修改于: 2020-12-30 00:36:45        🧑  作者: Mango
数据仓库的类型有不同类型的数据仓库,如下所示:基于主机的数据仓库可以实现两种类型的基于主机的数据仓库:基于主机的大型机仓库,位于大型数据库上。由诸如IBM System / 390,UNISYS和Data General后续系统之类的强大而可靠的大容量结构以及诸如Sybase,Oracle,Informix和DB2之类的数据库支持。基于主机的LAN数据仓库,可以在中央或从工作组环境中处理数据传递。...
📅  最后修改于: 2020-12-30 00:37:42        🧑  作者: Mango
数据仓库建模数据仓库建模是设计数据仓库的详细信息和摘要信息的模式的过程。数据仓库建模的目标是开发一个描述数据仓库需要支持的现实或事实的至少一部分的模式。数据仓库建模是构建数据仓库的重要阶段,主要有两个原因。首先,通过该架构,数据仓库客户端可以可视化仓库数据之间的关系,从而更加轻松地使用它们。其次,精心设计的架构允许出现有效的数据仓库结构,以帮助降低实现仓库的成本并提高使用效率。数据仓库中的数据建模...
📅  最后修改于: 2020-12-30 00:38:36        🧑  作者: Mango
数据仓库设计数据仓库是单个数据存储库,其中集成了来自多个数据源的记录以进行在线业务分析处理(OLAP)。这意味着数据仓库需要满足整个组织内所有业务阶段的需求。因此,数据仓库设计是一个非常复杂,冗长且容易出错的过程。此外,业务分析功能会随着时间而变化,从而导致系统要求发生变化。因此,数据仓库和OLAP系统是动态的,并且设计过程是连续的。数据仓库设计采用的方法不同于行业中的视图实现。它将数据仓库视为具...
📅  最后修改于: 2020-12-30 00:39:30        🧑  作者: Mango
数据仓库实施数据仓库中有各种实现,具体如下1.需求分析和容量规划:数据仓库的第一个过程涉及定义企业需求,定义体系结构,执行容量规划以及选择硬件和软件工具。此步骤将包括咨询高级管理层以及其他利益相关者。2.硬件集成:一旦选择了硬件和软件,就需要通过集成服务器,存储方法和用户软件工具来放置它们。3.建模:建模是一个重要的阶段,涉及设计仓库模式和视图。如果数据仓库很复杂,则可能包含使用建模工具。4.物理...
📅  最后修改于: 2020-12-30 00:40:25        🧑  作者: Mango
什么是元数据?元数据是有关数据的数据或有关用户所需信息的文档。在数据仓库中,元数据是必不可少的方面之一。元数据包括以下内容:仓库系统和组件的位置和说明。数据仓库和最终用户视图的名称,定义,结构和内容。识别权威数据源。用于填充数据的集成和转换规则。用于将信息传递给最终用户分析工具的集成和转换规则。用于将信息传递给分析订户的订阅信息。用于分析仓库使用情况和性能的指标。安全授权,访问控制列表等元数据用于...
📅  最后修改于: 2020-12-30 00:41:24        🧑  作者: Mango
什么是数据集市?数据集市是导演信息存储的子集,通常面向特定目的或主要数据主体,可以将其分发以满足业务需求。数据集市是分析性记录存储,旨在专注于组织内特定社区的特定业务功能。数据集市是从数据仓库中的数据子集派生的,尽管在自下而上的数据仓库设计方法中,数据仓库是从组织数据集市的联合创建的。数据集市的基本用途是商业智能(BI)应用程序。BI用于收集,存储,访问和分析记录。小型企业可以使用它来利用他们积累...
📅  最后修改于: 2020-12-30 00:42:20        🧑  作者: Mango
数据仓库交付流程现在我们讨论数据仓库的交付过程。数据仓库交付过程中使用的主要步骤如下:IT策略:DWH项目必须包含IT策略以获取和保留资金。业务案例分析:在设计了IT策略之后,下一步就是业务案例。必须了解可以证明其合理的投资水平,并认识到应该从使用数据仓库中获得的预期业务收益。教育和原型制作:公司将尝试数据分析的思想,并对数据仓库的价值进行自我教育。这很有价值,如果这是公司首次接触DS记录的好处,...