原文地址:http://blog.csdn.NET/liyaohhh/article/details/50824226

Rich feature hierarchies for accurate object

detection and semantic segmentation、

rcnn主要作用就是用于物体检测,就是首先通过selective search 选择2000个候选区域,这些区域中有我们需要的所对应的物体的bounding-box,然后对于每一个region proposal 都wrap到固定的大小的scale,224*224,对于每一个处理之后的图片,把他都放到CNN上去进行特征提取,得到每个region proposal的feature map,这些特征用固定长度的特征集合feature vector来表示。最后对于每一个类别,我们都会得到很多的feature vector,然后把这些特征向量直接放到svm现行分类器去判断,当前region所对应的实物是background还是所对应的物体类别,每个region 都会给出所对应的score,因为有些时候并不是说这些region中所包含的实物就一点都不存在,有些包含的多有些包含的少,包含的多少还需要合适的bounding-box,所以我们才会对于每一region给出包含实物类别多少的分数,选出前几个对大数值,然后再用非极大值抑制canny来进行边缘检测,最后就会得到所对应的bounding-box啦,整个架构如下图所示:

这篇paper中作者指出两个在inference的时候的关键点:第一:全部的参数在每种class类别都是共享的。第二点:和其他的方法相比较,我们最后的feature vector的维度都是相对较低的。

还有一个注意的地方:CNN中每层的参数都是如何训练出来的呢?首先:我们在ILSVRC 2012的数据集上进行分类训练,主要模拟的CNN模型是利用AlexNet进行分类,虽然最后的结果精度会有所降低,只是因为有些小小的改变而已,无伤大雅。这个过程是"pre-traing",如下图所示:

然后需要做的就是"fine-runing",主要就是对上面得到的model进行稍微的改动。首先改变了数据集的大小,前面用的数据集是比较大的,主要适用于进行分类,这里我们主要使用的是相对较小的,并且是通过selective search之后的region proposal 作为网络的输入。如果当前region  proposal的IOU大于0.5,把他标记为positive,其余的是作为negtive,去训练detection网络。并且对SGD的参数进行的适当的修改。

这个时候,上面的model中训练好了,之后,就需要对每一个region proposal进行特征集合feature vector训练好了,得到了特征就可以对每一个得到的特征输入到SVM进行分类看看这个feature vector所对应的region proposal是需要的物体呢?还是无关的实物(background),排序,canny边界检测之后就得到了我们需要的bounding-box啦.如下所示

总之感觉:r-cnn有点麻烦,他要先过一次classification得到分类的model,继而在得到的model上进行适当的改变又得到了detection的model,最后才开始在detection model cnn上进行边界检测。好麻烦,因为rcnn首先需要在AlexNet上进行分类的训练model,得到AlexNet之后才能进行分类。分类之后在改一下AxlexNet model 得到detection model,然后在上面利用SVM进行二分类判断当前的region有没有包含我们需要的物体(对结果进行排序,取前面的IOU最大的那几个),在对这些进行canny边缘检测,才可以得到bounding-box。

简单地说:就是r-cnn需要两次进行跑cnn model,第一次得到classification的结果,第二次才能得到bounding-box。但是r-cnn也不是一事无成,人家还是有自己的特点嘛,就提在原来的架构上提出为啥不用CNN来进行特征提取,而是用那些老套的sift,hog呢?当然科研界的大牛还是很厉害的啦,在r-cnn的基础上就提出了fast-rcnn,它解决了rcnn中跑了两次cnn才分别得到classification和bounding-box,牛掰之处在于ROI层的提出,下片再来看看。

R-CNN学习笔记2:Rich feature hierarchies for accurate object detection and semantic segmentation相关推荐

  1. RCNN学习笔记(1):Rich feature hierarchies for accurate object detection and semantic segmentation

    rcnn主要作用就是用于物体检测,就是首先通过selective search (1.基于图论的原始区域分割,详情见博文http://blog.csdn.net/surgewong/article/d ...

  2. 【RCNN】《Rich feature hierarchies for accurate object detection and semantic segmentation 》

    2014 CVPR   之前刚开始接触目标检测算法的时候,老是分不清deep learning中,物体检测和图片分类算法上的区别,弄得我头好晕,终于在这篇paper上,看到了解释.物体检测和图片分类的 ...

  3. 目标检测--Rich feature hierarchies for accurate object detection and semantic segmentation(CVPR 2014)

    Rich feature hierarchies for accurate object detection and semantic segmentation 作者: Ross Girshick J ...

  4. 目标检测经典论文——R-CNN论文翻译:Rich feature hierarchies for accurate object detection and semantic segmentation

    Rich feature hierarchies for accurate object detection and semantic segmentation--Tech report (v5) 用 ...

  5. 【论文精读】Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation(R-CNN)

    论文Title:Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation.发表于2014年. 本 ...

  6. 论文解读 | Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation

    论文地址:Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation GitHub地址: http ...

  7. RCNN详细介绍 Rich feature hierarchies for accurate object detection and semantic segmentation

    Rich feature hierarchies for accurate object detection and semantic segmentation Publisher: CVPR 201 ...

  8. Rich feature hierarchies for accurate object detection and semantic segmentation

    Abstract 在过去几年中,在标准PASCAL VOC数据集上测量的目标检测性能保持稳定.性能最好的方法是复杂的集成系统,通常将多个低级图像特征与高级上下文相结合.在本文中,我们提出了一种简单且可 ...

  9. 【R-CNN】Rich feature hierarchies for accurate object detection and semantic segmentation (2014) 全文翻译

    作者 Ross Girshick, Jeff Donahue, Trevor Darrell, Jitendra Malik (UC Berkeley, {rbg,jdonahue,trevor,ma ...

  10. 论文精读:R-CNN:Rich feature hierarchies for accurate object detection and semantic segmentation...

    1.论文核心 我们提出了一种简单且可扩展的检测算法,相对于之前对VOC2012的最佳结果,它将平均平均精度(mAP)提高了30%以上--实现了53.3%的mAP.我们的方法结合了两个关键的见解:(1) ...

最新文章

  1. Solaris下访问windows共享资源
  2. Jexus部署.Net Core项目
  3. mongodb和mysql的对比_MongoDB和MySQL的区别
  4. 开源分布式搜索平台ELK+Redis+Syslog-ng实现日志实时搜索
  5. 硬件测试含软件调试,硬件调试与测试规范.doc
  6. arp协议、arp应答出现的原因、arp应答过程、豁免ARP详细解答附图(建议电脑观看)
  7. Java基础语法初学者了解
  8. laravel重定向自定义显示提示消息
  9. java springmvc 后台读取文件,springMVC
  10. vrrp 理论和配置
  11. 苹果紧急修复已遭 NSO Group 利用的 iMessage 0day以及另一个0day
  12. C++基础——使用字符串作为函数模板的实参
  13. php定位并且获取天气信息
  14. Java学习环境的搭建
  15. Web - JSON基础讲解
  16. zbbz插件使用教程_cad坐标标注插件1.73版
  17. 微信第三方平台服务器,EasyWeChat微信开放平台第三方平台接入
  18. Win10桌面点鼠标右键一直转圈的解决方法
  19. 为什么 MySQL 不建议执行超过 3 表以上的多表关联查询?
  20. Android Studio 默认keystore 以及自定义keystore

热门文章

  1. CentOS6.5安装python3.7
  2. SQL数据查询语句(一)
  3. Linux配置多个tomcat
  4. sqlserver为数据库表增加自增字段
  5. w3c subscribe
  6. javaScript,Dwr分页模拟
  7. 给老板汇报技术规划的一些要点(转)
  8. 弹出“FRM-40400:事务完成:已应用和保存X条记录
  9. [UE4]关于分支Sequence和条件分支的组合用法
  10. Windows 8.1安装python出现api-ms-win-crt-runtime-l1-1-0.dll