先决条件 – 数据仓库
当用户具有解释作为特定主题引入的趋势的共享方式时,可以控制数据仓库。以下是数据仓库的主要特征:
- 面向主题——
数据仓库始终是面向主题的,因为它提供有关主题而不是组织当前操作的信息。它可以在特定主题上实现。这意味着建议数据仓库过程处理更明确的特定主题。这些主题可以是销售、分销、营销等。数据仓库从不只强调当前的操作。相反,它侧重于展示和分析数据以做出各种决策。它还通过消除不需要做出决策的数据来围绕特定主题提供简单而精确的演示。 - 融合的 –
它与以可靠格式制作的主题方向相同。集成意味着建立一个共享实体来扩展来自不同数据库的所有相似数据。数据还需要以共享和一般授权的方式驻留在各种数据仓库中。数据仓库是通过集成来自各种数据源(例如大型机和关系数据库)的数据来构建的。此外,它必须具有可靠的命名约定、格式和代码。数据仓库的集成有利于数据的有效分析。应确认命名约定、列缩放、编码结构等的可靠性。数据仓库的集成处理各种主题相关的仓库。 - 时变 –
在这些数据中,通过不同的时间间隔(例如每周、每月或每年等)进行维护。它在大型数据集之间建立了各种时间限制,并保存在在线交易流程 (OLTP) 中。数据仓库的时间限制比操作系统的时间限制范围更广。驻留在数据仓库中的数据可以在特定的时间间隔内进行预测,并从历史角度传递信息。它显式或隐式地包含时间元素。时变的另一个特点是,一旦数据存储在数据仓库中,就不能修改、更改或更新。 - 非挥发性 –
顾名思义,数据仓库中的数据是永久性的。这也意味着在插入新数据时不会擦除或删除数据。它包括插入到逻辑业务选定数量之间的修改的庞大数据量。它评估仓库技术内的分析。在这种情况下,数据是只读的,并以特定的时间间隔刷新。这有利于分析历史数据和理解功能。它不需要事务处理、重新捕获和并发控制机制。在操作应用程序中完成的删除、更新和插入等功能在数据仓库环境中丢失。在数据仓库中完成的两种类型的数据操作是:- 数据加载
- 数据访问
数据仓库的功能:
它作为数据的集合工作,这里由各种社区组织,这些社区具有恢复数据功能的功能。它存储了有关观察到的具有高事务级别的表的事实,以定义数据仓库技术和其中涉及的主要功能如下所述:
- 数据整合
- 数据清洗
- 数据整合