📜  数据仓库-面试问题

📅  最后修改于: 2021-01-07 06:04:10             🧑  作者: Mango


亲爱的读者,这些数据仓库面试问题是专门为使您熟悉在数据仓库主题的面试过程中可能遇到的问题的性质而设计的。

问:定义数据仓库?

:数据仓库是面向主题的,集成的,时变的且非易失性的数据收集,可支持管理层的决策过程。

问:面向主题的数据仓库代表什么?

:面向主题表示数据仓库围绕特定主题(例如产品,客户,销售等)存储信息。

问:列出数据仓库的任何五个应用程序。

:某些应用程序包括金融服务,银行服务,客户商品,零售部门,受控制造。

问:OLAP和OLTP代表什么?

:OLAP是Online Analytical Processing的缩写,而OLTP是Online Transactional Processing的缩写。

问:数据仓库和运营数据库之间最根本的区别是什么?

:数据仓库包含可用于业务分析的历史信息,而运营数据库则包含运行业务所需的当前信息。

问:列出数据仓库系统可以实现的架构。

:数据仓库可以实现星型模式,雪花模式和事实星座模式。

问:什么是数据仓库?

:数据仓库是构建和使用数据仓库的过程。

问:列出数据仓库中涉及的过程。

:数据仓库涉及数据清理,数据集成和数据合并。

问:列出数据仓库工具和实用程序的功能。

:数据仓库工具和实用程序执行的功能是数据提取,数据清理,数据转换,数据加载和刷新。

问:您所说的数据提取是什么意思?

:数据提取意味着从多个异构源收集数据。

问:定义元数据?

:元数据被简单地定义为关于数据的数据。换句话说,我们可以说元数据是将我们引向详细数据的汇总数据。

问:元数据呼吸包含什么?

:元数据呼吸包含数据仓库,业务元数据,操作元数据,用于从操作环境映射到数据仓库的数据以及汇总算法的定义。

问:数据多维数据集有何帮助?

:数据立方体可帮助我们以多个维度表示数据。数据多维数据集由维度和事实定义。

问:定义尺寸?

:维度是企业保存记录所依据的实体。

问:解释数据集市。

:数据集市包含组织范围数据的子集。数据的此子集对于组织的特定组来说很有价值。换句话说,我们可以说数据集市包含特定于特定组的数据。

问:什么是虚拟仓库?

:运行数据仓库的视图称为虚拟仓库。

问:列出数据仓库交付过程中涉及的阶段。

:这些阶段包括IT战略,教育,业务案例分析,技术蓝图,构建版本,历史记录加载,临时查询,需求演变,自动化和扩展范围。

问:定义负载管理器。

:负载管理器执行提取和加载过程所需的操作。负载管理器的大小和复杂性在不同的解决方案之间有所不同,具体解决方案从数据仓库到数据仓库。

问:定义负载管理器的功能。

:负载管理器从源系统提取数据。快速将提取的数据加载到临时数据存储中。执行简单的转换,使其结构类似于数据仓库中的结构。

问:定义一个仓库经理。

:仓库经理负责仓库管理过程。仓库管理器由第三方系统软件,C程序和Shell脚本组成。仓库管理器的大小和复杂性因具体解决方案而异。

问:定义仓库经理的职能。

:仓库管理器执行一致性和参照完整性检查,针对基础数据创建索引,业务视图,分区视图,将源数据转换并合并到临时存储中,再发布到已发布的数据仓库中,备份数据仓库中的数据,并存档已达到使用期限的数据。

问:什么是摘要信息?

:摘要信息是数据仓库中保留预定义聚合的区域。

问:查询管理器负责什么?

:查询管理器负责将查询定向到合适的表。

问:列出OLAP服务器的类型

:OLAP服务器有四种类型,即关系OLAP,多维OLAP,混合OLAP和专用SQL Server。

问:多维OLAP或关系OLAP中哪一个更快?

:多维OLAP比关系OLAP更快。

问:列出OLAP执行的功能。

:OLAP执行诸如上滚,下钻,切片,切块和枢轴之类的功能。

问:切片操作中选择了多少个尺寸?

:切片操作仅选择一个尺寸。

问:骰子操作中选择了多少个尺寸?

:对于骰子操作,为给定的多维数据集选择两个或多个维度。

问:星型模式中有多少个事实表?

:星型模式中只有一个事实表。

问:什么是规范化?

:规范化将数据拆分为其他表。

问:谁的维表已规范化的星型模式和雪花模式?

:雪花模式使用规范化的概念。

问:标准化的好处是什么?

:标准化有助于减少数据冗余。

问:使用哪种语言定义架构定义?

:数据挖掘查询语言(DMQL)用于模式定义。

问:DMQL的基础是什么语言?

:DMQL基于结构化查询语言(SQL)。

问:分区的原因是什么?

:出于各种原因进行分区,例如易于管理,协助备份恢复,提高性能。

问:数据市场营销涉及哪些成本?

:数据传输涉及硬件和软件成本,网络访问成本和时间成本。