📅  最后修改于: 2021-01-07 06:00:30             🧑  作者: Mango
流程经理负责维护流入和流出数据仓库的数据流。共有三种不同类型的流程管理器-
负载管理器执行提取数据并将数据加载到数据库中所需的操作。从一个数据仓库到另一个数据仓库的特定解决方案之间,负载管理器的大小和复杂性各不相同。
负载管理器确实执行以下功能-
从源系统中提取数据。
快速将提取的数据加载到临时数据存储中。
执行简单的转换,使其结构类似于数据仓库中的结构。
数据是从运营数据库或外部信息提供者中提取的。网关是用于提取数据的应用程序。它由基础DBMS支持,并允许客户端程序生成要在服务器上执行的SQL。开放数据库连接(ODBC)和Java数据库连接(JDBC)是网关的示例。
为了最大程度地减少总加载时间,需要在尽可能短的时间内将数据加载到仓库中。
转换影响数据处理的速度。
在应用转换和检查之前,将数据加载到关系数据库中更为有效。
网关技术不适合使用,因为当涉及大量数据时,它们的效率很低。
加载时,可能需要执行简单的转换。完成简单的转换后,我们可以进行复杂的检查。假设我们正在加载EPOS销售交易,我们需要执行以下检查-
仓库经理负责仓库管理过程。它由第三方系统软件,C程序和Shell脚本组成。仓库经理的规模和复杂性在特定解决方案之间有所不同。
仓库经理包括以下内容-
仓库经理执行以下功能-
分析数据以执行一致性和参照完整性检查。
根据基础数据创建索引,业务视图,分区视图。
生成新的聚合并更新现有的聚合。
生成规范化。
将临时存储的源数据转换并合并到已发布的数据仓库中。
备份数据仓库中的数据。
归档已达到其使用期限的数据。
注–仓库管理器分析查询概要文件以确定索引和聚合是否合适。
查询管理器负责将查询定向到合适的表。通过将查询定向到适当的表,可以加快查询请求和响应过程。另外,查询管理器负责调度用户发布的查询的执行。
查询管理器包括以下组件-
它以用户理解的形式向用户显示数据。
它计划最终用户发布的查询的执行。
它存储查询概要文件,以使仓库经理可以确定合适的索引和聚合。