R-CNN论文详细解读

最新推荐文章于 2024-12-15 05:00:00 发布

原创

最新推荐文章于 2024-12-15 05:00:00 发布 · 4.1k 阅读

·

12

·

标签

#R-CNN #CNN

R-CNN是13年https://arxiv.org/abs/1311.2524的论文。对计算机视觉的影响很大！

基础知识掌握：

①先来简单区分计算机视觉的任务：

简单来说，分类（classify）、定位（localization）和检测（detection）的区别如下：
classify：是什么？
localization：在哪里？是什么？（单个目标）
detection：在哪里？分别是什么？（多个目标）

②物体检测算法中常用到的几个概念：Bbox，IoU，非极大值抑制

Bounding Box(bbox)：

bbox是包含物体的最小矩形，该矩形既不太大以至于留出太多非物体空间，也不太小以至于没包住物体。

物体检测中关于物体位置的信息输出是一组(x,y,w,h)数据，其中x,y代表着bbox的左上角(或者其他固定点，可自定义)，对应的w,h表示bbox的宽和高.一组(x,y,w,h)可以唯一的确定一个定位框。

Intersection over Union(IoU)：

对于两个区域R和R′,则两个区域的重叠程度overlap计算如下:
O(R,R′)=|R∩R′| / |R∪R′|

在训练网络的时候，我们常依据侯选区域和标定区域的IoU值来确定正负样本。

非极大值抑制(Non-Maximum Suppression又称NMS)：

非极大值抑制(NMS)可以看做是局部最大值的搜索问题，集通过IOU计算分数最高的框，然后计算与刚刚最高分数那个框有太多重合的部分的框都去掉，这样就可以去掉那些不准确的框。

有了基础知识，下面来介绍R-CNN的内容：

如上图所示，R-CNN这个物体检查系统可以大致分为四步进行：
1、获取输入图像，提取约2000个候选区域

2、将候选图片进行缩放

3、将候选区域分别输入CNN网络

4、将CNN的输出输入SVM中进行类别的判定

5、将特征输入训练好的线形回归器中，得到更为精确的位置定位

上述五个步骤是一个大致的过程，而且是一个检测的过程，实际上训练过程比较麻烦，下面开始详细介绍。

一、候选区域的提取

近来有很多研究都提出了产生类别无关区域推荐的方法。比如: objectness（物体性），selective search（选择性搜索），category-independent object proposals(类别无关物体推荐)，constrained parametric min-cuts（受限参最小剪切, CPMC)，multi-scal combinatorial grou

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。