📅  最后修改于: 2020-12-30 00:41:24             🧑  作者: Mango
数据集市是导演信息存储的子集,通常面向特定目的或主要数据主体,可以将其分发以满足业务需求。数据集市是分析性记录存储,旨在专注于组织内特定社区的特定业务功能。数据集市是从数据仓库中的数据子集派生的,尽管在自下而上的数据仓库设计方法中,数据仓库是从组织数据集市的联合创建的。
数据集市的基本用途是商业智能(BI)应用程序。 BI用于收集,存储,访问和分析记录。小型企业可以使用它来利用他们积累的数据,因为它比实施数据仓库便宜。
设计数据集市的方法主要有两种。这些方法是
从属数据集市是较高数据仓库的物理子集的逻辑子集。根据此技术,数据集市被视为数据仓库的子集。在这种技术中,首先创建一个数据仓库,从中可以创建更多的各种数据集市。这些数据集市依赖于数据仓库并从中提取必要的记录。在这种技术中,当数据仓库创建数据集市时;因此,不需要数据集市集成。这也称为自顶向下方法。
第二种方法是独立数据集市(IDM)。在这里,首先创建独立的数据集市,然后使用这些独立的多个数据集市设计数据仓库。采用这种方法,因为所有数据集市都是独立设计的;因此,需要集成数据集市。由于集成了数据集市以开发数据仓库,因此也称为自底向上方法。
除了这两类之外,还存在一种称为“混合数据集市”的类型。
它使我们能够合并来自数据仓库以外的其他来源的输入。这在许多情况下可能会有所帮助;特别是在需要Adhoc集成时,例如在将新的组或产品添加到组织中之后。
实施数据集市的重要步骤是设计架构,构建物理存储,使用源系统中的数据填充数据集市,对其进行访问以做出明智的决策并随时间进行管理。因此,步骤如下:
设计步骤是数据集市过程中的第一步。此阶段涵盖所有功能,从启动对数据集市的请求到收集有关需求的数据以及开发数据集市的逻辑和物理设计。
它涉及以下任务:
此步骤包含创建与数据集市关联的物理数据库和逻辑结构,以提供对数据的快速有效访问。
它涉及以下任务:
此步骤包括与从源获取数据,清理数据,将其修改为正确的格式和详细程度并将其移入数据集市有关的所有任务。
它涉及以下任务:
此步骤涉及使用数据:查询数据,分析数据,创建报告,图表和图形并发布它们。
它涉及以下任务:
此步骤包含在整个数据集市的整个生命周期内对其进行管理。在此步骤中,管理功能的执行方式如下:
Data Warehouse | Data Mart |
---|---|
A Data Warehouse is a vast repository of information collected from various organizations or departments within a corporation. | A data mart is an only subtype of a Data Warehouses. It is architecture to meet the requirement of a specific user group. |
It may hold multiple subject areas. | It holds only one subject area. For example, Finance or Sales. |
It holds very detailed information. | It may hold more summarized data. |
Works to integrate all data sources | It concentrates on integrating data from a given subject area or set of source systems. |
In data warehousing, Fact constellation is used. | In Data Mart, Star Schema and Snowflake Schema are used. |
It is a Centralized System. It is a Decentralized System. |
|
Data Warehousing is the data-oriented. | Data Marts is a project-oriented. |