📝 数据仓库(Data Warehouse)
31篇技术文档📅  最后修改于: 2020-12-30 00:43:17        🧑  作者: Mango
什么是OLAP(在线分析处理)?OLAP代表在线分析处理。 OLAP是软件技术的一种分类,它授权分析人员,经理和执行人员通过快速,一致,交互式的访问,以多种可能的数据视图(从原始信息转换为反映实际数据的维度)来获取对信息的了解。客户所理解的企业。OLAP实现业务信息的多维分析,并支持复杂估计,趋势分析和复杂数据建模的功能。它正在迅速增强智能解决方案的基本基础,这些智能解决方案包括业务绩效管理,计划...
📅  最后修改于: 2020-12-30 00:44:11        🧑  作者: Mango
OLAP的特征在OLAP方法的FASMI特征中,从特征的首字母得出的术语是:快速它定义了哪个系统旨在在约五秒钟内向客户提供最多的反馈,而基本分析所用的时间不超过一秒钟,很少的分析所用的时间超过20秒。分析它定义了哪种方法可以处理与函数和用户相关的任何业务逻辑和统计分析,并使其对于目标客户足够容易。尽管可能需要进行一些预编程,但是如果所有应用程序定义都必须允许用户定义新的Adhoc计算作为分析的一部...
📅  最后修改于: 2020-12-30 00:45:05        🧑  作者: Mango
OLTP和OLAP之间的区别OLTP(在线事务处理)的特点是大量的短时间在线事务(INSERT,UPDATE和DELETE)。 OLTP操作的主要意义在于非常快速的查询处理,在多访问环境中保持记录完整性以及每秒事务数一致的有效性。在OLTP数据库中,有准确且最新的记录,用于保存事务数据库的模式是实体模型(通常为3NF)。OLAP(在线分析处理)以相对较低的交易量表示。查询非常困难并且涉及聚合。对于...
📅  最后修改于: 2020-12-30 00:46:09        🧑  作者: Mango
多维数据模型中的OLAP操作在多维模型中,记录被组织成多个维度,每个维度都包含由概念层次结构描述的多个抽象级别。该组织为用户提供了从各种角度查看数据的灵活性。存在许多OLAP数据多维数据集操作来演示这些不同的视图,从而允许进行交互式查询和对现有记录的搜索。因此,OLAP支持用于交互式数据分析的用户友好环境。考虑要在多维数据上执行的OLAP操作。该图显示了商店销售的数据多维数据集。多维数据集包含维度...
📅  最后修改于: 2020-12-30 00:47:06        🧑  作者: Mango
OLAP的类型OLAP服务器主要有以下三种:ROLAP代表关系OLAP,这是一个基于关系DBMS的应用程序。MOLAP代表多维OLAP,这是基于多维DBMS的应用程序。HOLAP代表混合OLAP,这是一种使用关系和多维技术的应用程序。关系OLAP(ROLAP)服务器这些是中间服务器,位于关系后端服务器和用户前端工具之间。他们使用关系或扩展关系DBMS来保存和处理仓库数据,并使用OLAP中间件来提供...
📅  最后修改于: 2020-12-30 00:48:05        🧑  作者: Mango
ROLAP,MOLAP和HOLAP之间的区别ROLAPMOLAPHOLAPROLAP stands for Relational Online Analytical Processing.MOLAP stands for Multidimensional Online Analytical Processing.HOLAP stands for Hybrid Online Analytical P...
📅  最后修改于: 2020-12-30 00:49:02        🧑  作者: Mango
什么是尺寸建模?维建模使用多维数据集操作表示数据,使用OLAP数据管理可以使逻辑数据表示更合适。维度建模的感知是由Ralph Kimball开发的,它由“事实”和“维度”表组成。在维建模中,交易记录分为“事实”(通常是数字交易数据)或“维度”(它们是为事实提供上下文的参考信息)。例如,销售交易可能会损害事实,例如订购的产品数量和产品价格,以及损害尺寸,例如订购日期,用户名,产品编号,订单运送至和开...
📅  最后修改于: 2020-12-30 00:49:55        🧑  作者: Mango
什么是多维数据模型?多维模型以数据多维数据集的形式查看数据。数据立方体使数据可以在多个维度上建模和查看。它由维度和事实定义。维度是组织保存记录所依据的观点或实体。例如,一家商店可以创建一个销售数据仓库,以保存维度时间,项目和位置的商店销售记录。这些尺寸使保存者可以跟踪事物,例如,物品的每月销售和物品的销售地点。每个维度都有一个与之相关的表,称为维度表,该表进一步描述了维度。例如,项目的尺寸表可能包...
📅  最后修改于: 2020-12-30 00:50:51        🧑  作者: Mango
什么是数据立方体?将数据分组或组合到称为“数据多维数据集”的多维矩阵中时。数据多维数据集方法具有一些替代名称或一些变体,例如“多维数据库”,“物化视图”和“ OLAP(在线分析处理)”。这种方法的总体思想是实现某些经常查询的昂贵计算。例如,可以将与架构销售(零件,供应商,客户和销售价格)的关系具体化为一组八个视图,如图1所示,其中psc表示由聚合函数值组成的视图(例如total-value)。通过...
📅  最后修改于: 2020-12-30 00:51:45        🧑  作者: Mango
什么是星型图?星型图式是维模型的基本形式,其中数据被组织为事实和维。事实是指经过计数或衡量的事件,例如销售或登录。维度包括有关该事实的参考数据,例如日期,项目或客户。星型模式是一种关系模式,其中其设计表示多维数据模型的关系模式。星型模式是显式数据仓库模式。之所以称为星型模式,是因为该模式的实体关系图模拟了一个星型,其点与中心表偏离。模式的中心由一个较大的事实表组成,星形的点是维表。事实表星型模式中...
📅  最后修改于: 2020-12-30 00:52:41        🧑  作者: Mango
什么是雪花模式?雪花模式等效于星型模式。 “如果一个或多个维度表不直接连接到事实表,而必须通过其他维度表进行联接,则该架构被称为雪花。”雪花模式是星型模式的扩展,星型的每个点都会爆炸成更多点。之所以称为雪花模式,是因为雪花模式的图类似于雪花。雪花化是一种规范STAR模式中的维表的方法。当我们完全标准化所有维度表时,生成的结构类似于雪花,中间是事实表。雪花用于开发特定查询的性能。绘制该架构时,每个事...
📅  最后修改于: 2020-12-30 00:53:36        🧑  作者: Mango
星型和雪花模式之间的区别星图在星型模式中,事实表将位于中心并连接到维度表。这些表完全处于非规范化结构中。由于涉及的连接数量较少,因此SQL查询性能良好。数据冗余度高,并占用更多磁盘空间。雪花模式雪花模式是星形模式的扩展,其中维表连接到一个或多个维。这些表在结构上部分非规范化。与星型模式相比,SQL查询的性能要低一些,因为涉及更多的联接。与星型架构相比,数据冗余度低并且占用的磁盘空间更少。让我们看一...
📅  最后修改于: 2020-12-30 00:54:31        🧑  作者: Mango
什么是事实星座图式?事实星座表示两个或多个共享一个或多个维度的事实表。也称为Galaxy模式。事实星座图描述了数据仓库或数据集市的逻辑结构。 Fact Constellation Schema可以使用一组非标准化的FACT,Shared和Conformed Dimension表进行设计。事实星座模式是一种复杂的数据库设计,难以汇总信息。事实星座图可以在汇总事实表之间实现,也可以将复杂的事实表分解为...
📅  最后修改于: 2020-12-30 00:55:24        🧑  作者: Mango
数据仓库流程架构流程体系结构定义了一种体系结构,其中对数据仓库中的数据进行处理以进行特定的计算。以下是两个基本过程体系结构:集中式流程架构在这种体系结构中,数据被收集到单个集中式存储中,并在完成后由具有内存,处理器和存储方面巨大结构的一台机器进行处理。集中式流程体系结构随事务处理而发展,非常适合具有一个服务位置的小型组织。从人员和系统角度来看,它都需要最少的资源。当数据的收集和使用在同一位置时,这...
📅  最后修改于: 2020-12-30 00:56:19        🧑  作者: Mango
数据库并行性的类型并行用于支持加速,因为提供了更多资源(例如处理器和磁盘),因此查询执行速度更快。并行性还用于提供扩展,其中通过增加并行度来管理不断增加的工作负载而无需增加响应时间。并行数据库系统的不同体系结构是共享内存,共享磁盘,无共享和分层结构。(a)水平并行:这意味着数据库跨多个磁盘分区,并且并行处理发生在特定任务(即表扫描)中,该任务在不同的处理器上针对不同的数据集同时执行。(b)垂直并行...