📜  数据仓库-流程管理器

📅  最后修改于: 2021-01-07 06:00:30             🧑  作者: Mango


流程经理负责维护流入和流出数据仓库的数据流。共有三种不同类型的流程管理器-

  • 负载管理器
  • 仓库经理
  • 查询管理器

数据仓库负载管理器

负载管理器执行提取数据并将数据加载到数据库中所需的操作。从一个数据仓库到另一个数据仓库的特定解决方案之间,负载管理器的大小和复杂性各不相同。

负载管理器架构

负载管理器确实执行以下功能-

  • 从源系统中提取数据。

  • 快速将提取的数据加载到临时数据存储中。

  • 执行简单的转换,使其结构类似于数据仓库中的结构。

负载管理器

从源提取数据

数据是从运营数据库或外部信息提供者中提取的。网关是用于提取数据的应用程序。它由基础DBMS支持,并允许客户端程序生成要在服务器上执行的SQL。开放数据库连接(ODBC)和Java数据库连接(JDBC)是网关的示例。

快速加载

  • 为了最大程度地减少总加载时间,需要在尽可能短的时间内将数据加载到仓库中。

  • 转换影响数据处理的速度。

  • 在应用转换和检查之前,将数据加载到关系数据库中更为有效。

  • 网关技术不适合使用,因为当涉及大量数据时,它们的效率很低。

简单转换

加载时,可能需要执行简单的转换。完成简单的转换后,我们可以进行复杂的检查。假设我们正在加载EPOS销售交易,我们需要执行以下检查-

  • 去除仓库中不需要的所有列。
  • 将所有值转换为所需的数据类型。

仓库经理

仓库经理负责仓库管理过程。它由第三方系统软件,C程序和Shell脚本组成。仓库经理的规模和复杂性在特定解决方案之间有所不同。

仓库经理架构

仓库经理包括以下内容-

  • 控制过程
  • 存储过程或带有SQL的C
  • 备份/恢复工具
  • SQL脚本

仓库经理

仓库经理的职能

仓库经理执行以下功能-

  • 分析数据以执行一致性和参照完整性检查。

  • 根据基础数据创建索引,业务视图,分区视图。

  • 生成新的聚合并更新现有的聚合。

  • 生成规范化。

  • 将临时存储的源数据转换并合并到已发布的数据仓库中。

  • 备份数据仓库中的数据。

  • 归档已达到其使用期限的数据。

–仓库管理器分析查询概要文件以确定索引和聚合是否合适。

查询管理器

查询管理器负责将查询定向到合适的表。通过将查询定向到适当的表,可以加快查询请求和响应过程。另外,查询管理器负责调度用户发布的查询的执行。

查询管理器架构

查询管理器包括以下组件-

  • 通过C工具或RDBMS进行查询重定向
  • 储存程序
  • 查询管理工具
  • 通过C工具或RDBMS进行查询调度
  • 通过第三方软件安排查询

查询管理器

查询管理器的功能

  • 它以用户理解的形式向用户显示数据。

  • 它计划最终用户发布的查询的执行。

  • 它存储查询概要文件,以使仓库经理可以确定合适的索引和聚合。