并行数据库介绍 - 芒果文档

在本文中，我们将讨论并行数据库的概述，然后将强调它们的需求和优势，最后，将通过示例介绍性能测量因素，如 Speedup 和 Scale-up。让我们一一讨论。

并行数据库：
如今，组织需要以高传输速率处理大量数据。对于此类要求，客户端-服务器或集中式系统效率不高。随着提高系统效率的需要，并行数据库的概念出现了。并行数据库系统旨在通过并行化概念来提高系统的性能。

需要：
并行使用多个资源，如 CPU 和磁盘。这些操作是同时执行的，而不是串行处理。并行服务器可以允许多台机器上的用户访问单个数据库。它还执行许多并行化操作，如数据加载、查询处理、构建索引和评估查询。

好处：
在这里，我们将讨论并行数据库的优势。我们来看一下。

性能改进 –
通过并行连接 CPU 和磁盘等多个资源，我们可以显着提高系统性能。
高可用性 –
在并行数据库中，节点之间的联系较少，因此一个节点的故障不会导致整个系统的故障。这相当于显着提高了数据库可用性。
适当的资源利用——
由于并行执行，CPU 永远不会是理想的。因此，资源的合理利用是存在的。
提高可靠性——
当一个站点出现故障时，可以继续执行另一个具有数据副本的可用站点。使系统更加可靠。

数据库的性能测量：
在这里，我们将强调性能测量因素，如加速和放大。让我们借助例子一一理解。

加速 –
通过增加资源数量在更短的时间内执行任务的能力称为加速。

Speedup=time original/time parallel
Where ,
time original = time required to execute the task using 1 processor
time parallel = time required to execute the task using 'n' processors

如图。理想加速曲线

例子 –

如图。 CPU 执行一个进程需要 3 分钟

如图。 ‘n’ CPU 需要 1 分钟才能通过分成较小的任务来执行一个进程

放大 –
当工作负载和资源按比例增加时保持系统性能的能力。

Scaleup = Volume Parallel/Volume Original
Where ,
Volume Parallel = volume executed in a given amount of time using 'n' processor
Volume Original = volume executed in a given amount of time using 1 processor

如图。理想的放大曲线

例子 –
20 个用户正在以 100% 的效率使用 CPU。如果我们尝试添加更多用户，那么单个处理器就不可能处理更多用户。可以添加一个新的处理器来并行地为用户服务。并将提供 200% 的效率。