📜  更快的 R-CNN |机器学习(1)

📅  最后修改于: 2023-12-03 14:55:13.140000             🧑  作者: Mango

更快的 R-CNN

什么是 R-CNN?

R-CNN(Region-based Convolutional Neural Network)是一个目标检测框架,由Ross Girshick等人于2014年提出。R-CNN通过对图像的不同区域应用卷积神经网络(CNN)提取特征,并利用支持向量机(SVM)分类器来预测这些区域中是否存在目标物体和其位置边界框。该框架包括三个阶段:

  1. 区域提取:使用选择性搜索(Selective Search)算法从图像中提取约2000个区域。

  2. 特征提取:对每个区域应用CNN提取特征。

  3. 分类:使用SVM进行分类并对每个区域进行边界框回归。

虽然R-CNN在准确性方面表现良好,但其训练和测试时间非常慢,限制了其在实际应用中的可扩展性。

更快的 R-CNN

更快的 R-CNN(Faster R-CNN)是由Shaoqing Ren等人于2015年提出的改进版 R-CNN。与 R-CNN 不同的是,更快的 R-CNN 中不再使用选择性搜索算法来提取区域,而是通过使用 Region Proposal Network (RPN)进行区域提取。

RPN是一种使用CNN来学习各种区域的先验框和相关性来生成区域提议的网络,它与 CNN 共享卷积层参数,因此在计算上使用共享的特征图,可以大大减少网络的计算量。RPN生成的区域提案进一步被送入一个 RoI (Region of Interest) pooling 层来提取其特征,然后送入分类器和回归器进行目标检测。

相较于 R-CNN,更快的 R-CNN 显著提高了检测速度,同时保持了检测性能。更快的 R-CNN 也为 Faster R-CNN 两阶段目标检测框架开辟了道路,逐渐成为当前目标检测领域的主流算法之一。

参考资料
  • S. Ren, K. He, R. Girshick, and J. Sun. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks. NIPS, 2015.
  • Faster R-CNN作者的GitHub主页