先决条件–数据仓库架构
数据仓库用于存储历史数据,有助于制定业务战略决策。它用于在线分析处理(OLAP),可帮助分析数据。数据仓库有助于业务主管系统地组织,接受和使用其数据来制定战略决策。
数据仓库到底是什么?
数据仓库的定义方式很多,因此很难制定严格的定义。渐渐地,数据仓库是与组织的运营数据库分离的数据存储库。数据仓库系统允许集成各种应用程序系统。它们通过提供可靠的汇总历史数据计划进行分析来支持信息处理。
数据仓库中的数据来自组织的操作系统以及其他外部资源。这些统称为源系统。从源系统提取的数据存储在一个称为数据暂存区的区域中,在该区域中将对数据进行清理,转换,组装和复制,以准备数据仓库中的数据。
数据暂存区通常是一组计算机,在其中进行诸如排序和顺序处理之类的简单活动。数据暂存区不提供。系统尽快提供查询或演示服务,将其分类为演示服务器。演示服务器是目标计算机,从数据登台区域将数据加载到目标计算机上,并直接存储数据以供最终用户,报告作者和其他应用程序查询。
数据仓库需要三种不同类型的系统–
- 源系统
- 数据暂存区
- 演示服务器
数据从数据源区域通过暂存区域移动到演示服务器。整个过程被称为ETL(提取,转换和加载)或ETT(提取,转换和转移)。
数据仓库架构的组成部分及其任务:
1.业务来源–
- 运营源是由运营数据和外部数据组成的数据源。
- 数据可以来自诸如Informix,Oracle之类的关系DBMS。
2.负载管理器–
- 负载管理器执行与提取数据仓库中的负载数据相关的所有操作。
- 这些任务包括简单的数据转换,以准备要输入仓库的数据。
3.仓库管理–
- 仓库经理负责仓库管理过程。
- 仓库经理执行的操作是数据的分析,汇总,备份和收集,数据的非规范化。
4.查询管理器–
- 查询管理器执行与用户查询管理相关的所有任务。
- 查询管理器的复杂性由最终用户访问操作工具和数据库提供的功能确定。
5.详细数据–
- 它用于将所有详细数据存储在数据库模式中。
- 详细数据被加载到数据仓库中以补充所收集的数据。
6.汇总数据–
- 汇总数据是存储预定义聚合的数据仓库的一部分
- 这些汇总由仓库经理生成。
7.存档和备份数据–
- 存储“详细数据”和“汇总数据”是为了存档和备份。
- 数据将重定位到磁带或光盘等存储档案中。
8.元数据–
- 元数据基本上是存储在数据之上的数据。
- 它用于提取和装载过程,仓库,管理过程和查询管理过程。
9.最终用户访问工具–
- 最终用户访问工具包括分析,报告和挖掘。
- 通过使用最终用户访问工具,用户可以与仓库链接。