📅  最后修改于: 2021-01-07 06:02:00             🧑  作者: Mango
数据仓库是一个复杂的系统,其中包含大量数据。因此,重要的是备份所有数据,以便将来可以根据需要恢复它们。在本章中,我们将讨论设计备份策略中的问题。
在继续进行操作之前,您应该了解下面讨论的一些备份术语。
完全备份-它同时备份整个数据库。该备份包括所有数据库文件,控制文件和日记文件。
部分备份-顾名思义,它不会创建数据库的完整备份。部分备份在大型数据库中非常有用,因为它们允许采取一种策略,即每天以循环方式备份数据库的各个部分,以便每周有效地备份整个数据库。
冷备份-在数据库完全关闭时进行冷备份。在多实例环境中,应关闭所有实例。
热备份-数据库引擎启动并运行时进行热备份。对于RDBMS,热备份的要求各不相同。
在线备份-与热备份非常相似。
决定要使用哪种硬件进行备份很重要。处理备份和还原的速度取决于所使用的硬件,硬件的连接方式,网络带宽,备份软件以及服务器I / O系统的速度。在这里,我们将讨论一些可用的硬件选择及其优缺点。这些选择如下-
磁带选择可以分类如下-
磁带媒体
磁带介质有几种。下表列出了一些磁带媒体标准-
Tape Media | Capacity | I/O rates |
---|---|---|
DLT | 40 GB | 3 MB/s |
3490e | 1.6 GB | 3 MB/s |
8 mm | 14 GB | 1 MB/s |
需要考虑的其他因素如下-
独立磁带机
磁带机可以通过以下方式连接-
将磁带机连接到数据仓库可能会出现问题。
考虑服务器是一台48node MPP机器。我们不知道连接磁带机的节点,也不知道如何将它们分布在服务器节点上以获得最佳性能,同时对服务器的干扰最小,内部I / O延迟也最小。
将磁带驱动器作为网络可用设备进行连接,要求网络能够处理巨大的数据传输速率。确保在您需要的时间内有足够的带宽可用。
远程连接磁带机也需要高带宽。
将多个磁带加载到单个磁带驱动器中的方法称为磁带堆叠器。堆叠器在完成当前磁带的装卸后将其卸下,然后装入下一个磁带,因此一次只能访问一个磁带。价格和功能可能有所不同,但是共同的功能是它们可以执行无人值守的备份。
磁带仓可提供较大的存储容量。磁带仓可以存储和管理数千个磁带。他们可以集成多个磁带驱动器。他们具有标记和存储所存储磁带的软件和硬件。筒仓通过网络或专用链接远程连接非常普遍。我们应该确保连接的带宽适合工作。
磁盘备份的方法是-
这些方法在OLTP系统中使用。这些方法最大程度地减少了数据库停机时间,并最大限度地提高了可用性。
磁盘到磁盘备份
在这里,备份是在磁盘而不是磁带上进行的。进行磁盘到磁盘备份的原因如下:
从磁盘到磁盘备份数据比向磁带备份数据快得多。但是,这是备份的中间步骤。之后,数据将备份到磁带上。磁盘到磁盘备份的另一个优点是,它为您提供了最新备份的在线副本。
镜破
想法是在工作日对磁盘进行镜像以恢复弹性。当需要备份时,可以分解其中一个镜像集。此技术是磁盘到磁盘备份的一种变体。
注–可能需要关闭数据库以保证备份的一致性。
光学自动点唱机允许将数据存储在线路附近。此技术允许以与磁带堆栈器或磁带仓相同的方式管理大量光盘。该技术的缺点是它的写入速度比磁盘慢。但是,光学介质具有长寿命和可靠性,这使其成为归档介质的理想选择。
有可用的软件工具可在备份过程中提供帮助。这些软件工具作为软件包提供。这些工具不仅可以进行备份,而且可以有效地管理和控制备份策略。市场上有许多可用的软件包。下表列出了其中一些-
Package Name | Vendor |
---|---|
Networker | Legato |
ADSM | IBM |
Epoch | Epoch Systems |
Omniback II | HP |
Alexandria | Sequent |
下面列出了选择最佳软件包的标准-