📅  最后修改于: 2021-01-07 06:04:10             🧑  作者: Mango
亲爱的读者,这些数据仓库面试问题是专门为使您熟悉在数据仓库主题的面试过程中可能遇到的问题的性质而设计的。
答:数据仓库是面向主题的,集成的,时变的且非易失性的数据收集,可支持管理层的决策过程。
答:面向主题表示数据仓库围绕特定主题(例如产品,客户,销售等)存储信息。
答:某些应用程序包括金融服务,银行服务,客户商品,零售部门,受控制造。
答:OLAP是Online Analytical Processing的缩写,而OLTP是Online Transactional Processing的缩写。
答:数据仓库包含可用于业务分析的历史信息,而运营数据库则包含运行业务所需的当前信息。
答:数据仓库可以实现星型模式,雪花模式和事实星座模式。
答:数据仓库是构建和使用数据仓库的过程。
答:数据仓库涉及数据清理,数据集成和数据合并。
答:数据仓库工具和实用程序执行的功能是数据提取,数据清理,数据转换,数据加载和刷新。
答:数据提取意味着从多个异构源收集数据。
答:元数据被简单地定义为关于数据的数据。换句话说,我们可以说元数据是将我们引向详细数据的汇总数据。
答:元数据呼吸包含数据仓库,业务元数据,操作元数据,用于从操作环境映射到数据仓库的数据以及汇总算法的定义。
答:数据立方体可帮助我们以多个维度表示数据。数据多维数据集由维度和事实定义。
答:维度是企业保存记录所依据的实体。
答:数据集市包含组织范围数据的子集。数据的此子集对于组织的特定组来说很有价值。换句话说,我们可以说数据集市包含特定于特定组的数据。
答:运行数据仓库的视图称为虚拟仓库。
答:这些阶段包括IT战略,教育,业务案例分析,技术蓝图,构建版本,历史记录加载,临时查询,需求演变,自动化和扩展范围。
答:负载管理器执行提取和加载过程所需的操作。负载管理器的大小和复杂性在不同的解决方案之间有所不同,具体解决方案从数据仓库到数据仓库。
答:负载管理器从源系统提取数据。快速将提取的数据加载到临时数据存储中。执行简单的转换,使其结构类似于数据仓库中的结构。
答:仓库经理负责仓库管理过程。仓库管理器由第三方系统软件,C程序和Shell脚本组成。仓库管理器的大小和复杂性因具体解决方案而异。
答:仓库管理器执行一致性和参照完整性检查,针对基础数据创建索引,业务视图,分区视图,将源数据转换并合并到临时存储中,再发布到已发布的数据仓库中,备份数据仓库中的数据,并存档已达到使用期限的数据。
答:摘要信息是数据仓库中保留预定义聚合的区域。
答:查询管理器负责将查询定向到合适的表。
答:OLAP服务器有四种类型,即关系OLAP,多维OLAP,混合OLAP和专用SQL Server。
答:多维OLAP比关系OLAP更快。
答:OLAP执行诸如上滚,下钻,切片,切块和枢轴之类的功能。
答:切片操作仅选择一个尺寸。
答:对于骰子操作,为给定的多维数据集选择两个或多个维度。
答:星型模式中只有一个事实表。
答:规范化将数据拆分为其他表。
答:雪花模式使用规范化的概念。
答:标准化有助于减少数据冗余。
答:数据挖掘查询语言(DMQL)用于模式定义。
答:DMQL基于结构化查询语言(SQL)。
答:出于各种原因进行分区,例如易于管理,协助备份恢复,提高性能。
答:数据传输涉及硬件和软件成本,网络访问成本和时间成本。