并行 DBMS 是一种跨多个处理器或 CPU 运行的 DBMS,主要旨在尽可能并行执行查询操作。并行 DBMS 链接许多较小的机器,以实现与单个大型机器相同的吞吐量。
在并行数据库中,并行DBMS主要有三种架构设计。它们如下:
- 共享内存架构
- 共享磁盘架构
- 无共享架构
让我们一一讨论它们:
1. 共享内存架构——在共享内存架构中,有多个 CPU 连接到一个互连网络。它们能够共享单个或全局主内存和公共磁盘阵列。需要注意的是,在这种架构中,多线程操作系统和多线程DBMS的单个副本可以支持这些多个CPU。此外,共享内存是一种固体耦合架构,其中多个 CPU 共享其内存。它也称为对称多处理 (SMP) 。这种架构的范围非常广泛,从个人工作站开始,通过 RISC 支持并行的几个微处理器。
好处 :
- 它为有限数量的处理器提供高速数据访问。
- 沟通是有效率的。
缺点:
- 它不能并行使用超过 80 或 100 个 CPU。
- 由于大量CPU 的增加,总线或互连网络被阻塞。
2. 共享磁盘架构:
在共享磁盘架构中,各种 CPU 连接到互连网络。在这种情况下,每个 CPU 都有自己的内存,并且它们都可以访问同一个磁盘。另外请注意,这里的内存不在 CPU 之间共享,因此每个节点都有自己的操作系统和 DBMS 副本。共享磁盘架构是一种松散耦合的架构,针对固有的集中式应用程序进行了优化。它们也被称为集群。
好处 :
- 互联网络不再是瓶颈,每个CPU都有自己的内存。
- 在共享磁盘架构中负载平衡更容易。
- 有更好的容错性。
缺点:
- 如果CPU数量增加,干扰和内存争用的问题也会增加。
- 还存在可扩展性问题。
3、无共享架构:
Shared Nothing Architecture 是多处理器架构,其中每个处理器都有自己的内存和磁盘存储。在这种情况下,多个 CPU 通过一个节点连接到一个互连网络。另外,请注意,没有两个 CPU 可以访问同一个磁盘区域。在此架构中,不共享内存或磁盘资源。它也称为大规模并行处理 (MPP)。
好处 :
- 由于不共享资源,因此具有更好的可扩展性
- 可以添加多个 CPU
缺点:
- 通信成本较高,因为它涉及在两端发送数据和软件交互
- 非本地磁盘访问的成本高于共享磁盘架构的成本。
请注意,此技术通常用于大小为 10 12字节或 TB 的超大型数据库,或用于每秒处理数千个事务的系统。