R-CNN是13年https://arxiv.org/abs/1311.2524的论文。对计算机视觉的影响很大!
基础知识掌握:
①先来简单区分计算机视觉的任务:

简单来说,分类(classify)、定位(localization)和检测(detection)的区别如下:
classify:是什么?
localization:在哪里?是什么?(单个目标)
detection:在哪里?分别是什么?(多个目标)
②物体检测算法中常用到的几个概念:Bbox,IoU,非极大值抑制
Bounding Box(bbox):
bbox是包含物体的最小矩形,该矩形既不太大以至于留出太多非物体空间,也不太小以至于没包住物体。
物体检测中关于物体位置的信息输出是一组(x,y,w,h)数据,其中x,y代表着bbox的左上角(或者其他固定点,可自定义),对应的w,h表示bbox的宽和高.一组(x,y,w,h)可以唯一的确定一个定位框。
Intersection over Union(IoU):
对于两个区域R和R′,则两个区域的重叠程度overlap计算如下:
O(R,R′)=|R∩R′| / |R∪R′|
在训练网络的时候,我们常依据侯选区域和标定区域的IoU值来确定正负样本。
非极大值抑制(Non-Maximum Suppression又称NMS):
非极大值抑制(NMS)可以看做是局部最大值的搜索问题,集通过IOU计算分数最高的框,然后计算与刚刚最高分数那个框有太多重合的部分的框都去掉,这样就可以去掉那些不准确的框。
有了基础知识,下面来介绍R-CNN的内容:

如上图所示,R-CNN这个物体检查系统可以大致分为四步进行:
1、获取输入图像,提取约2000个候选区域
2、将候选图片进行缩放
3、将候选区域分别输入CNN网络
4、将CNN的输出输入SVM中进行类别的判定
5、将特征输入训练好的线形回归器中,得到更为精确的位置定位
上述五个步骤是一个大致的过程,而且是一个检测的过程,实际上训练过程比较麻烦,下面开始详细介绍。
一、候选区域的提取
近来有很多研究都提出了产生类别无关区域推荐的方法。比如: objectness(物体性),selective search(选择性搜索),category-independent object proposals(类别无关物体推荐),constrained parametric min-cuts(受限参最小剪切, CPMC),multi-scal combinatorial grou


1080

被折叠的 条评论
为什么被折叠?



