📜  软件公差

📅  最后修改于: 2022-05-13 01:57:00.478000             🧑  作者: Mango

软件公差

在本文中,我们将从一般的容错到容错的优缺点来讨论软件容错。所以,让我们深入了解一下这篇文章,以更好地理解这个概念。

容错:
容错是一个术语,用于解释软件即使在其组件发生故障后仍继续执行其系统操作。软件容错是软件检测和从运行软件的系统中的软件或硬件中发生或已经发生的故障中恢复的能力,以便根据参数提供帮助。软件容错是构建从嵌入式系统到数据仓库系统的下一代高可用、高可靠计算系统必不可少的设备。软件容错不仅仅是一种解决方案,它已成为下一代系统开发过程中需要包含的重要组成部分。

软件故障大多发生在软件开发过程中。软件制造,软件的复制,被认为是准确的。基于容错特性设计的系统应该在满足需求方面问题较少。

软件容错技术:

  • 硬件容错技术
  • 软件容错技术

软件故障:
当设计师误解客户给出的要求或只是犯了错误时,就会出现设计错误。软件故障很常见,原因通常是现代系统中的复杂性经常被还原到系统的软件部分。据观察,目前计算机故障的 70-85% 来自软件错误。软件故障也可能来自硬件;这些故障通常在本质上是暂时的,可以使用现有软件和硬件容错技术的组合来包括在内。

如何应用容错:
容错系统由许多组件组成,这些组件在系统发生故障时用作备份。这些包括:

  1. 物理系统——
    它由相同或等效的系统支持。例如,服务器可以通过使用并行运行的同一配置服务器来利用容错属性,所有操作都模仿备份服务器。
  2. 虚拟系统 –
    它由其他软件实例保留。例如,包含客户信息的数据库可以连续存储在另一台机器上。如果当前数据库发生故障,那么操作可以自动重定向到存储的数据库。

什么是容错架构?
有一种不同的方法可以创建容错服务器平台,从而防止数据丢失并避免计划外停机。计算机体系结构中的容错简单地描述了管理员和工程师做出的决定,以便即使在发生故障的情况下系统也能保持运行。

可以考虑开发不同的容错工具。在驱动器控制器级别,廉价磁盘冗余阵列 (RAID) 是一种常见的容错策略,可以在开发时实施。可以使用各种设施级形式的容错,包括冷站点、热站点、温站点和重复站点。容错计算在灾难恢复和中断期间发挥着重要作用。出于这个原因,容错策略还包括一些不间断电源(UPS),例如发电机,即使在电网发生故障后也能独立运行。拜占庭容错(BFT)是未来容错架构的另一个问题。 BFT 系统对于区块链、核能和航天工业来说是必要的,因为即使系统中的某些节点发生故障或由恶意行为者驱动,这些系统也能防止停机。

容错的优点:

  • 这是一个旨在提供同一系统的多个副本并在系统出现故障时切换到另一个可用副本的系统。
  • 如果其中一个系统发生故障,则可以使用相同系统的存储副本在新环境中测试系统的其他功能,而不会干扰核心系统。
  • 使用这种策略,即使系统的单个部分出现故障,整个系统也将继续工作。
  • 各种级别的容错应用程序可以保护系统免受恶意攻击和黑客攻击。
  • 冗余当主系统发生故障时,可以自动实现在不同位置复制相同系统的相同副本。

容错的缺点:

  • 在某些情况下,如果在开发过程中发生故障,那么在备份系统中工作会导致不同的错误。
  • 为了保护数据在故障期间不丢失,我们必须单独购买组件以供当前使用和备份目的,这导致购买不同组件的成本增加。
  • 容错设计利用了不同的不太安全的组件,这可能导致不同的安全问题。