Title: Faster R-CNN: Towards Real-Time ObjectDetection with Region Proposal Networks
why
看猴脸那篇用FasterRCNN跑的检测效果还不错,所以就准备跑一下FasterRCNN试试,一方面yolo那个代码看着难受,想换个看看。
Conv layer
这部分就是 卷积 relu 池化,注意是加了padding的不改变shape的卷积,池化缩小为原来一半,输出的就是feature maps,卷积层的参数值和RPN和Fast RCNN共享。
Region Proposal Network (RPN)
RPN主要的作用就是生成候选区域,对于生成的feature map的每个像素点的k个候选框进行positive和negative判断,只对positive进行精确回归。
RoI Pooling
因为生成的候选框可能有边界越界、大小形状不可控等问题,所以将其上采样后再进行pooling可以保持都为7*7的大小,方便后续处理。
Classification and Regression
这一层已经算是识别的范围了,分为两个branch,其中一个是回归,通过box的回归将box的位置更精确,另一个branch是分类层(cls),判断box内的物体的label。
图片中im_info是一些图片下采样信息。 相关文章 https://senitco.github.io/2017/09/02/faster-rcnn/
https://zhuanlan.zhihu.com/p/31426458