📅  最后修改于: 2020-12-01 08:48:02             🧑  作者: Mango
商业智能(BI)在几个领域和组织中正变得越来越重要。在不断增长的竞争世界中,基于历史数据的决策和预测已变得至关重要。各种来源的内部和外部都有大量数据可用于任何类型的数据分析。
但是,挑战在于根据当前需求从可用的大数据中提取相关数据,并以一种友好的方式存储数据,以便从数据中得出不同的见解。因此,通过使用关键业务术语而获得的数据模型是有价值的通信工具。数据模型还需要提供一种根据需要生成报告的快速方法。
BI系统的数据建模使您能够应对许多数据挑战。
BI的数据模型应满足正在对其进行数据分析的业务的需求。以下是任何数据模型都必须满足的最低基本要求-
适用于一条业务线的数据模型可能不适用于另一条业务线。因此,必须基于特定业务,所使用的业务术语,数据类型及其关系来开发数据模型。它应基于组织中制定的目标和决策类型。
数据模型应包括通过元数据,层次结构和继承实现的内置智能,以促进高效,有效的商业智能流程。这样,您将能够为不同的用户提供一个通用平台,从而避免重复该过程。
数据模型应精确呈现特定于业务的数据。它应该启用有效的磁盘和内存存储,以便于快速处理和报告。
数据模型应该能够快速有效地适应不断变化的业务场景。可能必须包含新数据或新数据类型。数据刷新可能必须有效处理。
BI的数据建模包括以下步骤-
建立数据模型所需的数据可以来自各种来源,并且可以采用不同的格式。您需要确定特定数据分析需要这些数据源中的每个数据的哪一部分。这称为整形数据。
例如,如果要检索组织中所有员工的数据,则需要确定每个员工的哪些详细信息与当前上下文相关。换句话说,您需要确定employee表的哪些列需要导入。这是因为,数据模型中表中的列数越少,表中的计算就越快。
您需要加载已识别的数据–在每个表中都具有选定列的数据表。
接下来,您需要定义各个表之间的逻辑关系,以利于合并这些表中的数据,即如果您有一个表-产品-包含有关产品的数据,以及一个表-销售-与产品的各种销售交易,通过定义两个表之间的关系,可以总结产品的销售情况。
确定数据模型中数据的适当数据类型对于计算的准确性至关重要。对于已导入的每个表中的每一列,您需要定义数据类型。例如,文本数据类型,实数数据类型,整数数据类型等。
这是BI日期建模的关键步骤。建立的数据模型可能必须与需要了解数据趋势并在很短的时间内做出所需决策的几个人共享。因此,从源数据创建新的数据见解将是有效的,从而避免了分析工作。
新的数据洞察可以采用元数据的形式,特定业务人员可以轻松理解和使用。
一旦数据模型准备就绪,就可以根据需求分析数据。呈现分析结果也是重要的一步,因为将根据报告做出决策。