📜  Nagios-检查和状态

📅  最后修改于: 2020-10-31 13:45:54             🧑  作者: Mango


在Nagios上配置主机和服务后,将使用检查来查看主机和服务是否按预期运行。让我们看一个在主机上执行检查的示例-

考虑到您已经将主机定义放在/ usr / local / nagios / etc / objects目录中的host1.cfg文件中。

cd /usr/local/nagios/etc/objects
gedit host1.cfg

这是您的主机定义当前的外观-

define host {
   host_name host1
   address 10.0.0.1
}

现在让我们添加check_interval指令。该伪指令用于对主机设置的编号执行计划的检查。默认情况下,以分钟为单位。使用以下定义,将每3分钟对主机进行一次检查。

define host {
   host_name host1
   address 10.0.0.1
   check_interval 3
}

在Nagios中,对主机和服务执行两种类型的检查-

  • 主动检查
  • 被动检查

主动检查

主动检查由Nagios流程启动,然后定期执行。 Nagios进程中的检查逻辑将启动活动检查。为了监视远程计算机上运行的主机和服务,Nagios执行插件并告知要收集哪些信息。然后,插件将在远程计算机上执行,该计算机将收集所需的信息,然后将其发送回Nagios守护程序。根据主机和服务上收到的状态,采取适当的措施。

下图显示了主动检查-

主动检查

它们按照check_interval和retry_interval定义的规则间隔执行。

被动检查由外部过程执行,并将结果返回给Nagios进行处理。

被动检查的工作原理如下-

外部应用程序检查主机/服务上的状态,并将结果写入外部命令文件。当Nagios守护程序读取外部命令文件时,它将读取并发送队列中的所有被动检查,以便稍后进行处理。定期处理这些检查时,将根据检查结果中的信息发送通知或警报。

下图显示了被动检查-

被动检查

因此,主动和被动检查之间的区别是主动检查由Nagios运行,被动检查由外部应用程序运行。

当您无法定期监视主机/服务时,这些检查很有用。

Nagios会存储正在监视的主机和服务的状态,以确定它们是否正常运行。在许多情况下,故障将随机发生并且是暂时的;因此,Nagios使用状态来检查主机或服务的当前状态。

有两种状态-

  • 软状态
  • 硬态

软状态

当主机或服务在很短的时间内关闭并且其状态未知或与先前的状态不同时,将使用软状态。主机或服务将被反复测试,直到状态变为永久。

硬状态

当执行max_check_attempts并且主机或服务的状态仍然不正常时,则使用硬状态。 Nagios执行事件处理程序以处理硬状态。

下图显示了软状态和硬状态。

软硬状态