📅  最后修改于: 2020-12-30 00:40:25             🧑  作者: Mango
元数据是有关数据的数据或有关用户所需信息的文档。在数据仓库中,元数据是必不可少的方面之一。
元数据包括以下内容:
元数据用于构建,维护,管理和使用数据仓库。元数据允许用户访问以帮助理解内容和查找数据。
元数据就像一个神经中心。在数据仓库的构建和管理过程中的各种过程会生成部分数据仓库元数据。另一个使用由一个进程生成的元数据的一部分。在数据仓库中,元数据占据关键位置,并支持各种方法之间的通信。它充当数据仓库的神经中枢。
该图显示了元数据在数据仓库中的位置。
数据仓库中的元数据分为三个主要部分:
众所周知,数据仓库的数据来自企业的各种操作系统。这些源系统包括不同的数据结构。为数据仓库选择的数据元素具有各种字段长度和数据类型。
在从数据仓库的源系统中选择信息时,我们划分记录,合并来自不同源文件的文档因素,并处理多种编码方案和字段长度。当我们向最终用户交付信息时,我们必须能够将其绑定到源数据集。操作元数据包含有关操作数据源的所有这些信息。
提取和转换元数据包括有关从源系统中删除数据的数据,即提取频率,提取方法和用于数据提取的业务规则。同样,此元数据类别包含有关在数据登台区域中发生的所有数据转换的信息。
最终用户元数据是数据仓库的导航图。它使最终用户可以从数据仓库中查找数据。最终用户元数据允许最终用户使用其业务术语并以他们通常认为业务的那些方式来查找信息。
提出了元数据交换倡议,以将行业供应商和用户召集在一起,以解决与交换,共享和管理元数据有关的各种严重问题。元数据交换标准的目标是定义一种可扩展的机制,该机制将允许供应商交换标准元数据以及携带“专有”元数据。创始成员同意以下初步目标:
交换标准元数据模型的实现假设元数据本身可以以任何类型的存储格式存储:ASCII文件,关系表,固定或自定义格式等。
它是一个基于框架的框架,该框架会将访问请求转换为标准交换索引。
在元数据交换联盟中已经提出了几种方法:
在一种过程方法中,与API的通信内置于该工具中。它实现了最高程度的灵活性。
在ASCII批处理方法中,而不是依赖ASCII文件格式,该文件格式包含构成交换标准元数据模型的各种元数据项和标准化访问要求的信息。
在混合方法中,它遵循数据驱动模型。
1)标准元数据模型:它是指ASCII文件格式,用于表示正在交换的元数据。
2)描述最少API函数数量的标准访问框架。
3)工具配置文件,由每个工具供应商提供。
4)用户配置是一个文件,解释用户环境中元数据的合法交换路径。
元数据本身位于元数据存储库中,并由元数据存储库控制。元数据存储库管理软件可用于将源数据映射到目标数据库,集成和转换数据,生成用于数据转换的代码以及将数据移至仓库。