📜  用于图像识别的卷积块

📅  最后修改于: 2022-05-13 01:58:08.897000             🧑  作者: Mango

用于图像识别的卷积块

基本的神经网络设计(即一个输入层、几个密集层和一个输出层)不适用于图像识别系统,因为对象可以出现在图像中的许多不同位置。所以解决方案是添加一个或多个卷积层。

基础神经网络

卷积层有助于检测我们图像中的模式,无论它们出现在哪里。在定位模式时,这些层非常精确。对于相对简单的图像,一两个卷积层和一个厚层可能就足够了,但对于复杂的图像,我们需要一些额外的修改和方法来使我们的模型更高效。

CNN(卷积神经网络)

我们通常不需要知道在图像中的哪个位置检测到单个像素的模式,因为卷积层会在我们的图像中寻找模式并记录它们是否在我们图像的每个部分中找到这样的模式。大致了解它的发现地点就足够了。我们可以使用一种称为最大池的技术来解决这个问题。

具有最大池化层的卷积神经网络

数据减少了,只有重要的位由Max-pooling 层传递。它有助于减少发送到下一层的数据量。例如,如果卷积滤波器产生一个网格,最大池化层将识别网格的最大整数。最后,它将构造一个新数组,该数组将只保存它选择的整数。我们仍在大致记录每个图案在图像中的位置,但只记录了 1/4 的数据。我们最终会得到几乎相同的结果,但工作量会少很多。

神经网络的另一个问题是它试图记住输入数据,而不是学习过程和工作。有一种简单的方法可以避免这种情况:我们可以通过记忆训练数据来强制神经网络尽可能多地学习。目的是将 dropout 层夹在其他层之间,这将通过切断一些神经网络的连接来随机丢弃一些通过它的输入。神经网络被迫付出更多的努力去学习。因为它不能一直依赖流经神经网络的单个信号,它必须学习许多方法来表示相同的想法。

Dropout是一个令人困惑的概念,我们丢弃数据以获得更准确的最终结果,但它在实践中非常有效。

辍学层

这 3 层一起形成了卷积块。对于复杂的场景,我们可以相应地添加多个卷积块。

卷积块