以下是HP Vertica的功能以及为什么您应该将其与传统数据库管理系统分开使用。 HP Vertica 是用于处理大量数据或大数据的数据库产品。它是为分析目的而构建的关系数据库管理系统。
HP Vertica 的特点:
这些如下:
- 柱状取向:
在 HP vertica 中,数据以列的形式存储,而不是按行存储。数据的列式存储的主要原因是最小化读取和写入操作并更快地检索查询输出。 - 高级压缩:
编码和压缩技术用于优化查询性能并节省存储空间。查询性能,节省存储空间。编码是将数据转换为标准格式的过程。 Vertica 可以直接处理编码数据。压缩是将数据转换为紧凑格式的过程。 Vertica 无法直接处理压缩数据。数据必须先解压缩。最常用的编码和压缩方法是运行长度编码(RLE)、Deltaval 编码和 LZO(基于 Lempel-Ziv-Oberhumer)压缩。
- 高可用性:
Vertica 旨在实现高可用性。高可用性是数据库即使节点出现故障也能继续运行的能力。如果一个节点出现故障,则在其中一个幸存的节点上有一个副本可用,如下所示。Vertica 通过查询其他节点自动恢复丢失的数据。
- 大规模并行处理:
Vertica 是一种无共享架构,它允许集群中的每个节点在运行查询时处理其数据库部分。公网用于与外界通信。私网用于节点内通信(查询计划、查询结果、数据加载)。
我们可以实时连续加载数据到任何节点。请求将通过使查询执行的节点发起者之一和其他人作为执行者来平均分配和管理。
- 应用集成:
HP vertica 将来自不同位置或不同数据源的数据组合在一起,这称为应用程序集成。 ETL(Extraction , Transform and load )工具用于从不同的数据库中提取数据并将它们转换为标准形式并将其放入另一个数据库存储库中。 - 自动数据库设计:
为了高效地自动设计数据库,HP vertica 使用了一种称为数据库设计器的工具。当数据从行存储数据源加载到 vertica 时,vertica 会将数据转换为基于列的投影。投影不是在创建表时形成的,而是在数据初始加载到数据库表时形成的。