📜  什么是显着图?

📅  最后修改于: 2022-05-13 01:58:08.395000             🧑  作者: Mango

什么是显着图?

显着图是深度学习和计算机视觉的一个重要概念。在训练鸟类图像时,CNN 如何知道专注于与鸟类相关的像素,而忽略图像中的树叶和其他背景事物?通过使用显着图的概念。

显着图

显着图是一种图像,其中像素的亮度表示像素的显着程度,即像素的亮度与其显着性成正比。它通常是灰度图像。显着图也称为热图,其中热度是指图像中对预测对象所属类别有很大影响的那些区域。
显着性图的目的是根据显着性的空间分布,找出视野中每个位置突出或显着的区域,并指导参与位置的选择。
它用于各种视觉注意力模型。 “ITTI and Koch”视觉注意力计算模型基于显着图的概念。

例子:

这是一个例子,右图是左图的显着图,显示了对CNN更关注的区域。

为什么我们使用显着图

通常,我们将图像作为输入,并使用整个图像来预测输出。因此,如果我们有一张鸟的图像并且我们预测了鸟,但并非整个输入实际上很重要,并且并非整个输入对预测输出的贡献相同。因此,如果我们有一个非常大的图像,其中我们想要预测的类别只有几个像素,因此计算整个输入并不是一个好主意,即为什么我们使用显着图来突出显示图像的重要区域并仅处理突出显示的部分.它实际上将有助于减轻计算负担。



如何创建显着图?

它是通过使用以下步骤创建的。

  • 我们有一个图像和基本特征,如颜色、方向、强度是从图像中提取的。
  • 这些处理后的图像用于创建高斯金字塔以创建特征图。
  • 显着图是通过取所有特征图的平均值来创建的。

显着图在各个领域的应用

  • 兴趣区域提取:显着图用于提取最潜在的兴趣区域。
  • 图像裁剪:它选择感兴趣的区域,然后我们可以裁剪不明显的区域。
  • 图像字幕:用于图像字幕以识别对象。
  • 医学成像:用于医学图像处理 MRI 图像。
  • 机器人主动视觉:机器人技术是一个非常大的应用领域,具有各种需求。它用于图像配准、地标提取、物体识别和机器人动作引导。
  • 音频监控:显着性模型用于发现经典上下文声音中的异常声音,例如地铁站音频环境中的枪声。