📜  并行数据库介绍

📅  最后修改于: 2021-09-09 11:59:27             🧑  作者: Mango

在本文中,我们将讨论并行数据库的概述,然后将强调它们的需求和优势,最后,将通过示例介绍性能测量因素,如 Speedup 和 Scale-up。让我们一一讨论。

并行数据库:
如今,组织需要以高传输速率处理大量数据。对于此类要求,客户端-服务器或集中式系统效率不高。随着提高系统效率的需要,并行数据库的概念出现了。并行数据库系统旨在通过并行化概念来提高系统的性能。

需要 :
并行使用多个资源,如 CPU 和磁盘。这些操作是同时执行的,而不是串行处理。并行服务器可以允许多台机器上的用户访问单个数据库。它还执行许多并行化操作,如数据加载、查询处理、构建索引和评估查询。

好处 :
在这里,我们将讨论并行数据库的优势。我们来看一下。

  1. 性能改进 –
    通过并行连接 CPU 和磁盘等多个资源,我们可以显着提高系统性能。
  2. 高可用性 –
    在并行数据库中,节点之间的联系较少,因此一个节点的故障不会导致整个系统的故障。这相当于显着提高了数据库可用性。
  3. 适当的资源利用——
    由于并行执行,CPU 永远不会是理想的。因此,资源的合理利用是存在的。
  4. 提高可靠性——
    当一个站点出现故障时,可以继续执行另一个具有数据副本的可用站点。使系统更加可靠。

数据库的性能测量:
在这里,我们将强调性能测量因素,如加速和放大。让我们借助例子一一理解。

加速 –
通过增加资源数量在更短的时间内执行任务的能力称为加速。

Speedup=time original/time parallel
Where ,
time original = time required to execute the task using 1 processor
time parallel = time required to execute the task using 'n' processors

如图。理想加速曲线

例子 –

如图。 CPU 执行一个进程需要 3 分钟

如图。 ‘n’ CPU 需要 1 分钟才能通过分成较小的任务来执行一个进程

放大 –
当工作负载和资源按比例增加时保持系统性能的能力。

Scaleup = Volume Parallel/Volume Original
Where ,
Volume Parallel = volume executed in a given amount of time using 'n' processor
Volume Original = volume executed in a given amount of time using 1 processor

如图。理想的放大曲线

例子 –
20 个用户正在以 100% 的效率使用 CPU。如果我们尝试添加更多用户,那么单个处理器就不可能处理更多用户。可以添加一个新的处理器来并行地为用户服务。并将提供 200% 的效率。