📜  数据仓库实现

📅  最后修改于: 2020-12-30 00:39:30             🧑  作者: Mango

数据仓库实施

数据仓库中有各种实现,具体如下

1.需求分析和容量规划:数据仓库的第一个过程涉及定义企业需求,定义体系结构,执行容量规划以及选择硬件和软件工具。此步骤将包括咨询高级管理层以及其他利益相关者。

2.硬件集成:一旦选择了硬件和软件,就需要通过集成服务器,存储方法和用户软件工具来放置它们。

3.建模:建模是一个重要的阶段,涉及设计仓库模式和视图。如果数据仓库很复杂,则可能包含使用建模工具。

4.物理建模:为了使数据仓库有效执行,需要进行物理建模。这包括设计物理数据仓库组织,数据放置,数据分区,确定访问技术和建立索引。

5.来源:数据仓库的信息可能来自多个数据来源。此步骤包含使用网关,ODBC驱动器或另一个包装器标识和连接源。

6. ETL:来自源系统的数据将需要经过ETL阶段。设计和实施ETL阶段的过程可能包含定义合适的ETL工具供应商以及购买和实施工具。这可能包含定制工具以适合企业的需求。

7.填充数据仓库:商定了ETL工具后,可能需要使用暂存区进行测试。一旦一切工作正常,可以使用ETL工具在给定架构和视图定义的情况下填充仓库。

8.用户应用程序:为了对数据仓库有所帮助,必须有最终用户应用程序。此步骤包含设计和实施最终用户所需的应用程序。

9.推出仓库和应用程序:填充数据仓库并测试最终客户端应用程序后,可以推出仓库系统和操作,以供用户社区使用。

实施准则

1.增量构建:数据仓库必须增量构建。通常,建议创建一个数据集市时要牢记一个特定的项目,并且一旦实施该项目,企业的其他几个部门也可能希望实施类似的系统。然后可以以迭代方式实现企业数据仓库,从而允许所有数据集市从数据仓库中提取信息。

2.需要一个冠军:数据仓库项目必须有一个冠军,他要积极地对项目的预期价格和收益进行大量研究。数据仓库项目需要企业中许多部门的投入,因此需要由与企业中的人员进行交互并能积极说服同事的人驱动。

3.高级管理人员的支持:数据仓库项目必须得到高级管理人员的完全支持。考虑到此类项目的资源密集型特征以及实施这些项目所花费的时间,仓库项目发出信号,要求高级管理层作出持续的承诺。

4.确保质量:唯一已清除且组织隐含的质量的记录应加载到数据仓库中。

5.公司战略:数据仓库项目必须适合公司战略和业务目标。必须在项目开始之前定义项目的目的。

6.商业计划书:所有利益相关者必须清楚地概述和理解财务成本(硬件,软件和人员软件),预期优势以及数据仓库项目的项目计划。没有这种理解,关于支出和收益的谣言就可能成为唯一的数据来源,从而颠覆了项目。

7.培训:数据仓库项目一定不能忽视数据仓库的培训要求。为了使数据仓库项目成功,必须培训客户使用仓库和了解其功能的能力。

8.适应性:项目应具有灵活性,以便在需要时以及在需要时可以对数据仓库进行更改。像任何系统一样,数据仓库将需要随着企业需求的变化而变化。

9.联合管理:项目必须由企业中的IT和业务专业人员共同处理。为了确保与利益相关者进行适当的沟通,并且以该项目为目标来协助企业的业务,业务专业人员必须与技术专业人员一起参与该项目。