📜  数据集市的实施

📅  最后修改于: 2022-05-13 01:57:01.856000             🧑  作者: Mango

数据集市的实施

先决条件 - 数据集市
为了实现数据集市,我们需要遵循一些特定的步骤。它包括设计物理和逻辑结构,将数据加载到数据集市,从中访问数据以管理数据集市。每一步都在实施成功的数据集市中发挥着重要作用。

以下是实现数据集市的步骤:

  • 设计
  • 建造
  • 填充
  • 访问和管理

    以下是上述步骤的详细说明:

    1. 设计
      设计是实现数据集市的第一步。由于数据集市存储与特定主题相关的数据,因此该步骤包括识别与哪个数据集市将存储数据相关的主题或主题。它还包括收集与主题相关的信息的来源,然后设计数据集市的逻辑和物理结构。

      要遵循的步骤:

      • 主体识别。
      • 收集信息的来源。
      • 设计逻辑和物理结构。

      ER图用于设计数据集市的整体结构和功能。

    2. 建造
      构建是实施数据集市的第二阶段。它包括构建第一步设计的数据集市的物理和逻辑结构。
      物理结构意味着构建数据库以便可以轻松地从中访问数据,逻辑结构意味着外部模式。

      要遵循的步骤:

      • 构建第一阶段设计的物理数据库。

      为了设计数据库,需要RDBMS软件。它有助于实现与主题相关的表和视图。

    3. 填充
      填充阶段包括将数据放入数据集市。在将数据放入数据仓库之前,需要从源中提取数据,对其进行清洗并转换为正确的格式,然后将校正后的数据放入数据集市。需要执行这些步骤,以便存储在数据集市中的数据是合适的。

      填充时要遵循的步骤包括:

      • 从外部来源提取数据。
      • 通过将提取的数据转换为正确的格式来清理它。
      • 将正确的数据加载到数据集市。

      ETL 工具用于从源中提取、转换和加载数据到数据集市。

    4. 访问
      现在数据集市已准备好使用其数据。这是通过发出与查询相关的请求来访问数据的时间。我们可以通过命令行或 GUI 平台访问数据集市中的数据。通过基于 GUI 的平台进行查询是用户友好的,并且被许多组织相对使用。

      访问时要遵循的步骤包括:

      • 设置一个层将数据库结构转换为业务术语,以便非技术人员可以轻松访问数据集市中的数据。
      • 设置数据库结构。
      • 维护界面。

      需要能够轻松接受用户请求并显示相关结果的 GUI。

    5. 管理
      这是实施数据集市的最后一步。它包括管理数据集市以供长期使用的所有管理任务。

      管理包括以下内容:

      • 在系统出现故障时维护数据的恢复。
      • 在数据集市中添加和删除数据
      • 应优化从数据集市访问数据的过程以提高性能。