📅  最后修改于: 2023-12-03 14:55:13.140000             🧑  作者: Mango
R-CNN(Region-based Convolutional Neural Network)是一个目标检测框架,由Ross Girshick等人于2014年提出。R-CNN通过对图像的不同区域应用卷积神经网络(CNN)提取特征,并利用支持向量机(SVM)分类器来预测这些区域中是否存在目标物体和其位置边界框。该框架包括三个阶段:
区域提取:使用选择性搜索(Selective Search)算法从图像中提取约2000个区域。
特征提取:对每个区域应用CNN提取特征。
分类:使用SVM进行分类并对每个区域进行边界框回归。
虽然R-CNN在准确性方面表现良好,但其训练和测试时间非常慢,限制了其在实际应用中的可扩展性。
更快的 R-CNN(Faster R-CNN)是由Shaoqing Ren等人于2015年提出的改进版 R-CNN。与 R-CNN 不同的是,更快的 R-CNN 中不再使用选择性搜索算法来提取区域,而是通过使用 Region Proposal Network (RPN)进行区域提取。
RPN是一种使用CNN来学习各种区域的先验框和相关性来生成区域提议的网络,它与 CNN 共享卷积层参数,因此在计算上使用共享的特征图,可以大大减少网络的计算量。RPN生成的区域提案进一步被送入一个 RoI (Region of Interest) pooling 层来提取其特征,然后送入分类器和回归器进行目标检测。
相较于 R-CNN,更快的 R-CNN 显著提高了检测速度,同时保持了检测性能。更快的 R-CNN 也为 Faster R-CNN 两阶段目标检测框架开辟了道路,逐渐成为当前目标检测领域的主流算法之一。