Amazon CloudWatch是一项用于实时监视和观察资源的服务,专为DevOps工程师,开发人员,站点可靠性工程师(SRE)和IT经理而构建。 CloudWatch为用户提供数据和可操作的见解,以监视他们各自的应用程序,促进系统范围内的性能变化并优化资源利用率。 CloudWatch以日志,指标和事件的形式收集监视和运营数据,从而为其用户提供 在AWS上运行的AWS资源,应用程序和服务的聚合视图。 CloudWatch还可以用于检测环境中的异常行为,设置警告和警报,并排可视化日志和指标,采取自动操作并解决问题。
与Amazon Cloudwatch相关的术语
指标
- 它代表了按时间顺序排列的一组数据点,这些数据点已发布到Amazon CloudWatch
- 所有数据点都标有时间戳
- 指标是一个受监视的变量,数据点是该变量随时间的值
- 它们由名称,名称空间和零个或多个维度唯一定义
- 指标数学用于查询多个cloudwatch指标,并使用数学表达式基于这些指标创建新的时间序列
方面
- 维度是唯一标识指标的名称/值对
- 维度是指标的唯一标识符,因此,每当您向其中一个指标添加唯一的名称/值对时,便会创建该指标的新变体。
统计数据
- 统计信息是指定时间段内的度量标准数据聚合
- Cloudwatch上可用的统计信息很少,包括最大值,最小值,总和,平均值和样本数。
警报
- 用于代表我们自动启动操作
- 它在指定的时间段内监视单个指标,并根据指标的值执行一个或多个指定的操作
- 估计的AWS费用也可以使用警报进行监控
百分位数
- 它代表数据在数据集中的相对权重
- 它可以帮助用户更好地了解指标数据的分布
Cloudwatch仪表板
- 提供了一个用户友好的Cloudwatch控制台,该控制台用于在单个视图中监视资源。
- 您可以创建的cloudwatch仪表盘数量没有限制。
- 这些仪表板是全局的,而不是特定于区域的
Cloudwatch代理
- 需要安装
- 它从EC2实例和本地服务器收集日志和系统级指标
Cloudwatch活动:
- Cloudwatch事件可帮助您创建与任何事件(即,停止EC2实例)匹配的一组规则。
- 可以将这些事件路由到一个或多个目标,例如AWS Lambda函数,Amazon SNS主题,Amazon SQS队列和其他目标类型。
- Cloudwatch Events会持续观察操作事件,并且只要事件状态发生任何变化,它都会通过发送通知,激活lambda等来执行操作。
- 事件表明AWS环境发生了变化。每当AWS资源的状态发生变化时,就会生成事件。
- 规则用于匹配事件并路由到目标。
- 目标流程事件。它们包括Amazon EC2实例,AWS Lambda函数等。目标接收JSON格式的事件。
Cloudwatch日志:
- Amazon Cloudwatch日志使您能够存储,监视和访问来自AWS资源(例如Amazon EC2实例,Route53等)的文件。
- 它还可以帮助您解决系统错误并在高度耐用的存储中维护日志。
- 它还会创建有关Route 53接收的DNS查询的信息日志
Amazon Cloudwatch用例
当托管gfg网站的实例停止时通知gfg网站管理团队每当实例(托管GeeksForGeeks网站的实例)的CPU使用率超过80%时,都会触发cloudwatch事件。然后,此cloudwatch事件激活SNS主题,该主题将警报电子邮件发送给附加的gfg订阅者。
步骤1:让我们假设您已经启动了一个带有名称标签“ instance”的实例。
第2步:转到SNS主题仪表板,然后单击创建主题
步骤3:您将被带到该仪表盘。现在指定名称和显示名称。
步骤4:向下滚动并单击创建主题。
步骤5: SNS主题创建成功。
第6步:转到SNS主题仪表板,然后单击gfgtopic链接。
步骤7 :在“订阅”部分下,单击“创建订阅”。
步骤8 :选择Email作为协议,并指定Endpoint中订阅者的电子邮件地址。单击创建订阅。现在,转到指定电子邮件ID的邮箱,然后单击“确认订阅”。
步骤9:转到AWS管理控制台上的cloudwatch仪表板。单击左侧窗格中的指标。
第10步:在“所有指标”部分中,点击EC2
步骤11 :点击每实例指标
步骤12 :选择您启动的实例
第13步:转到“图形化指标”,单击响铃图标
步骤14:此仪表板显示Amazon Cloudwatch的组件,例如名称空间,指标名称,统计信息等
步骤15:选择更大的阈值。另外,指定阈值的数量(即80)。单击下一步。
第16步:单击“选择现有的SNS主题”,并提及您现在创建的SNS主题的名称。
步骤17 :指定警报名称和描述,这是完全可选的。单击下一步,然后单击创建警报。
步骤18 :告警创建成功。
步骤19 :您可以看到在CPU使用率超过80%时发出通知的图表。
Amazon Cloudwatch的优势
- 如今,Web应用程序会产生大量数据,因此Amazon Cloudwatch充当包含整个数据的有组织集合的仪表板。
- 它通过提供警报来提高总体拥有成本,并在提供的限制有错误时采取自动措施。
- 通过检查日志和度量标准数据,可以优化应用程序和资源。
- 通过诸如CPU利用率,容量利用率,内存利用率等数据提供了来自应用程序的详细见解。
- 它提供了一个很好的平台来比较和对比各种AWS服务生成的数据。