📜  数据仓库-概念(1)

📅  最后修改于: 2023-12-03 14:54:53.690000             🧑  作者: Mango

数据仓库-概念

数据仓库(Data Warehouse)是业务智能系统中最核心的部分,它是用于支持企业经营决策的关键信息系统。数据仓库从所有企业应用系统中收集、清洗和整合数据,并将其转化为供决策支持系统使用的一种高度聚合、易于理解和分析的格式,从而帮助企业做出更科学的、更精确的管理决策。

组成

数据仓库由以下几个组成部分构成:

  • 数据源(Data Source):从数据源中提取需要的数据,包括企业内部数据和外部数据,比如ERP、CRM、POS等;
  • 数据清洗(Data Cleaning):对数据进行整合、去除重复、校验合法性、修复错误等操作,以消除数据质量问题;
  • 数据转化(Data Transformation):将数据从源格式转化为针对决策支持系统所采用的数据仓库格式,包括对数据的高度聚合,分组,连接等操作;
  • 数据存储(Data Storage):将经过清洗和转化后的数据存储到数据仓库中,包括多维数据库、数据挖掘等;
  • 数据检索(Data Retrieval):从数据仓库中提取需要的数据,并按用户需求进行预处理和操作,以输出对决策有用的信息,比如报表、分析等。
作用

数据仓库具有以下重要作用:

  • 提高决策效率:通过清洗、整合和分析各个系统中的数据,提供给决策者更精确、更准确、更完整的数据,从而提高决策效率和决策质量;
  • 整合和共享数据:数据仓库作为一个中央化的数据存储库,整合来自企业各个部门的数据,从而实现数据共享与数据一致性。同时,数据仓库所提供的数据也是经过加工和处理的,更容易被各个部门和个人理解;
  • 支持企业经营管理:数据仓库所提供的数据主要服务于企业管理人员,从而有利于企业的经营管理与决策。
总结

数据仓库是支持企业决策系统的核心组成部分。它通过收集、清洗和整合来自各个数据源的数据,生成适用于决策支持系统的格式化数据,并以此来提高企业决策的质量和效率。同时,数据仓库还可以促进企业各部门之间的数据共享和一致性。