数据仓库存储大量数据,通常从文件,DBMS等多个异构源收集数据,以产生有助于决策的统计结果。
测试对于数据仓库系统进行数据验证并使其正确有效地工作非常重要。
在数据仓库上执行三个基本测试级别,如下所示:
- 单元测试–
这种类型的测试是在开发人员的末端进行的。在单元测试中,模块的每个单元/组件都经过单独测试。整个数据仓库的每个模块,即程序,SQL脚本,过程,Unix Shell,都经过验证和测试。 - 集成测试–
在这种类型的测试中,将应用程序的各个单个单元/模块组合在一起或组合在一起,然后针对输入数量进行测试。执行此操作以检测集成模块中的故障,并测试集成后各个组件是否运行良好。 - 系统测试–
系统测试是验证和测试整个数据仓库应用程序的测试形式。这种类型的测试由技术测试团队执行。此测试是在开发人员的团队执行单元测试之后进行的,该测试的主要目的是检查整个系统是否完全正常运行。
数据仓库测试的挑战是:
- 从多个来源选择数据并进行后续分析带来了巨大挑战。
- 数据的数量和复杂性,某些测试策略非常耗时。
- ETL测试需要精通的SQL技能,因此对SQL技能有限的测试人员提出了挑战。
- 数据仓库中的冗余数据。
- 报告不一致和不正确。
ETL测试分为五个阶段:
- 识别数据源和需求。
- 数据采集。
- 实现业务逻辑和维度建模。
- 构建并填充数据。
- 建立报告。