论文 : << Deep Neural Networks for Object Detection >>
      作者 : Christian Szegedy Alexander Toshev Dumitru Erhan

来源: Google
是否开放代码: 否
主要思想:利用DNN来做目标检测,因为现在的CNN等深度学习在识别上面做的还挺好,但是在目标检测上面,好像没有特别突出的结果。目标检测 = 目标识别 +目标定位;
本文中作者把目标检测看做一个回归问题,回归目标窗口(BoundingBox)的位置,
寻找一张图片当中目标类别和目标出现的位置。
当前的目标检测方法效果比较好的是DPM(可变形部分模型)模型,建立在目标表示和目标可分解为由多个Part组成的模型,它是一种图模型,利用判别性学习这种图模型在目标检测中取得了不错的结果。

目标检测最重要的问题:1.大小(分辨率) 2.如何不滑动窗口来做(滑动窗口实在是太慢了)。
文章说明了:1. 基于DNN的回归不但可以学习有利于分类的特征,同时它也能够捕获到目标的几何信息;

主要内容
通过设计基于DNN的回归,它的输出为二值化mask(掩码?反正就是来表示目标的位置信息),并且实现了从掩码中提取检测到的目标窗口,利用DNN的掩码回归问题中,即考虑到了完整图像的多尺度问题,同时也考虑到了一些小数量的图像裁剪块,然后以此精化;

在实现中,作者基于NIPS2012ImageNet那篇,直接把最后一层替换为回归层。

其它的基于DNN的检测方法或多或少是基于局部或者半局部分类器来做的,这这篇文章中采用的是利用整幅图像作为输入,然后通过位置回归来做的,这样的方法显然比滑动窗口的方法来说更加的高效;

对于存在的三个问题:1 .单个掩码可能区分开那些相互靠近的目标,2.由于输出大小的限制,产生的掩码会比原始图像小很多,所以这样就不能够精确的定位,3.因为输入是整张图像,一些小的图片能够影响到的输入神经元很少,所以将导致不易识别;

1.为了解决第一个问题:目标相互靠近的情况:
作者生成多个掩码,每个掩码表示着对应的完整的目标或者部分目标,他们使用一个网络来预测目标窗口掩码,使用4个附加的网络来检测4个半部分窗口,上下左右。这5个预测的结果是过完全的,但是可以减少不确定性和一些掩码错误。这样当有两个相同对象靠近出现在图像中时,产生的5个掩码至少有两个是不会合并在一起的,这样就可以区分开不同的目标;

==========================================

未完~~

【论文笔记】Deep Neural Networks for Object Detection相关推荐

  1. [论文笔记]Deep Neural Networks are Easily Fooled: High Confidence Predictions for Unrecognizable Images

    作者:Anh Nguyen, Jason Yosinski, Jeff Clune 链接:https://arxiv.org/pdf/1412.1897.pdf 摘要: 本文的工作基于Christia ...

  2. [论文解读]Deep active learning for object detection

    Deep active learning for object detection 文章目录 Deep active learning for object detection 简介 摘要 初步 以前 ...

  3. [论文阅读笔记]Deep Neural Networks are Easily Fooled:High Confidence Predictions for Unrecognizable Images

    Deep Neural Networks are Easily Fooled:High Confidence Predictions for Unrecognizable Images(CVPR201 ...

  4. LCDet Low-Complexity Fully-Convolutional Neural Networks for Object Detection in Embedded Systems

    Subarna Tripathi UC San Diego∗ stripathi@ucsd.edu Byeongkeun Kang UC San Diego bkkang@ucsd.edu V asu ...

  5. 论文翻译——Feature Pyramid Networks for Object Detection

    摘要: 特征金字塔是识别系统中检测不同尺度目标的基本组成部分.但最近的深度学习对象检测器已经避免了金字塔表示,部分原因是它们需要大量的计算和内存.本文利用深度卷积网络固有的多尺度金字塔层次结构,以额外 ...

  6. 论文笔记 Semantics-Guided Neural Networks for Efficient Skeleton-Based Human Action Recognition - CVPR

    Semantics-Guided Neural Networks for Efficient Skeleton-Based Human Action Recognition 2020 CVPR | c ...

  7. IEEE TGRS2019|【论文笔记】R2-CNN: Fast Tiny Object Detection in Large-Scale Remote Sensing Images

    R²-CNN: Fast Tiny Object Detection in Large-Scale Remote Sensing Images 快速轻量的大尺度遥感图像目标检测框架 论文地址:http ...

  8. 小目标检测论文笔记:Learning Calibrated-Guidance for Object Detection in Aerial Images

    论文 Learning Calibrated-Guidance for Object Detection in Aerial Images paper:https://arxiv.org/abs/21 ...

  9. 论文笔记 | Improving neural networks by preventing co-adaptation of feature detectors

    Authors G. E. Hinton , N. Srivastava, A. Krizhevsky, I. Sutskever and R. R. Salakhutdinov Hinton Abs ...

  10. Youtube推荐系统论文-《Deep Neural Networks for YouTube Recommendations》-简单总结

    文章目录 前言 一.背景介绍 二.整体架构 三.召回层 四.排序层 前言 今天要学习的是一篇关于推荐系统的经典的论文,它是由google在2016年发表的,应用场景是youtube上的视频推荐,然后这 ...

最新文章

  1. Uploadify导致Chrome频繁崩溃Crash
  2. 说说Android桌面(Launcher应用)背后的故事(二)——应用程序的添加
  3. 一些在NLP的面试中提问频率非常高的问题
  4. java负数右移_Java中负数的右移
  5. method=post和method=get的区别是啥【汇总】
  6. 热力地图高德_高德地图:最新动态
  7. 拒绝了对对象 'sp_sdidebug'(数据库 'master',所有者 'dbo')的 EXECUTE 权限
  8. position:搜索框显示历史浏览记录
  9. 关于一个跨域的小问题
  10. java两矩阵相加(二维矩阵重要细节解析)
  11. 如何使用MISRA改进嵌入式编程
  12. oracle sqlldr decode,sqlldr时遇到的一个问题
  13. 不会c语言能考408,考研408究竟有多难?
  14. 16*16点阵字库HZK16的使用
  15. 一种正负2.5V电源设计方案(TL431+SGM3207)
  16. vue+element-ui之表格中如何插入图片链接
  17. “搭讪学” 这不仅仅是泡妞
  18. dubbo服务暴露流程总结
  19. 普通用户登录出现“sorry, that didn‘t work please try again”
  20. 无法解析的外部符号 __imp____iob_func

热门文章

  1. 7-28 搜索树判断(25 分)
  2. 删除VS工程下的临时文件
  3. jQuery事件命名空间多事件绑定自定义事件js 命名空间 javascript命名空间
  4. VS 中PageLayout 属性设置
  5. c++——const关键字
  6. Struts2(接受表单参数)请求数据自动封装和数据类型转换
  7. yii2 gii页面404和debug调试栏无法显示解决方法
  8. Spring学习总结四——SpringIOC容器四
  9. 微信小程序开发教程第五章:微信小程序名片夹详情页开发
  10. Oracle新建用户及权限