OverFeat官方:http://cilvr.nyu.edu/doku.php?id=code:start

参考博客:
http://blog.csdn.net/hjimce/article/details/50187881
http://blog.csdn.net/whiteinblue/article/details/43374195
摘要:
本文提出一种整合框架,通过卷积网络来实现分类、定位、检测三种不同的功能。首先介绍在ConvNet中怎么添加一种滑窗机制,然后也提出了一种新颖的深度学习方法通过目标boundaries来进行目标定位,其中边界区域是逐渐累积得到的。通过单个网络可以同时完成不同的taskes(分类、定位、检测)。这个框架在ILSVRC2013目标检测分来中取得了非常好的成绩。创建了一个前沿方法来进行目标检测。OverFeat特征提取已经发行(http://cilvr.nyu.edu/doku.php?id=software:overfeat:start)。

1、介绍
ConvNets的优势是端对端的训练网络,从图像的底层像素特性到最后的分类输出,每一层都可以作为特许证提取。但是不足就是在训练过程中对标签信息的依赖比较大。
本文主要思想就是训练出一个同时能分类、定位、检测的网络,很明显,他们之间有相辅相成作用。所以会使功能性能更好。比如可以直接结合定位预测(localization predictions)来进行目标检测,检测就不需要backgroud samples了,没有在背景样本上训练,那么网络会集中在positive classes上,定位会更准确。
对于以前的分类网络框架,采用的ImageNet数据,其中分类目标是占整张图像的中心区域,或者大部分人区域。但是对于目标只是图像中的一小个区域还能够很好的分类吗?对于这种情况,提出了三种方法,第一种:可以通过滑窗机制进行。借用对于一张图像的多目标定位的滑窗机制,不需要检测整个目标,只要含有目标的一部分,就可以进行分类了。每个不同的viewing windows含有object中的一部分,不是entire Object或者center of the object,但是这种方法分类结果并不好;第二种:除了每个window的categories,还有定位预测以及边缘大小;第三种:在每个位置和大小区域累积categories置信度。
分析了多任务、人脸检测、姿态分析、定位等现状,并说明本文方法是第一次提出用convNet做定位、检测。提出的评估标注(evaluation criterion)能够更好的提高预测结果。

2、视觉任务
分类、定位、检测三个任务中,前面是后面任务的子任务。分类、定位可以输出一个正确的、以及五个猜想的;但是检测就是检测到多少个就输出多少个;其中定位也是需要背景训练图像。分类、定位的dataset是一样的,但是检测需要添加一些小目标,以及一些显著目标不存在的图像集。

3、第一个任务:分类
分类网络结构基本是AlexNet的前五层;只是其中对feature map进行了offset pooling.
定位网络结构在AlexNet后面全连接层不使用SoftMax分类结构,而是用一个回归网络,这样就可以进行定位预测了;测试结构中会把测试图像做不同resize,论文Table5表格中给了6种不同的输入size;比AlexNet灵活(图像的size可以是任意的)网络与view越匹配,置信度越高。

未完,具体算法改进待续~

将分类与定位网络结合起来就是detection;
‘AlexNet’ network
input 3*224*224

‘fast’ network (table 1 in http://arxiv.org/abs/1312.6229):
input 3x231x231
stage 1: convo: 11×11 stride 4×4; ReLU; maxpool: 2×2 stride 2×2; output (layer 3): 96x24x24
stage 2: convo: 5×5 stride 1×1; ReLU; maxpool: 2×2 stride 2×2; output (layer 6): 256x12x12
stage 3: convo: 3×3 stride 1×1 0-padded; ReLU; output (layer 9) 512x12x12
stage 4: convo: 3×3 stride 1×1 0-padded; ReLU; output (layer 12) 1024x12x12
stage 5: convo: 3×3 stride 1×1 0-padded; ReLU; maxpool: 2×2 stride 2×2; output (layer 16) 1024x6x6
stage 6: convo: 6×6 stride 1×1; ReLU; output (layer 18) 3072x1x1
stage 7: full; ReLU; output (layer 20) 4096x1x1
stage 8: full; output (layer 21) 1000x1x1
output stage: softmax; output (layer 22) 1000x1x1

‘accurate’ network (table 2 in http://arxiv.org/abs/1312.6229):
input 3x221x221
stage 1: convo: 7×7 stride 2×2; ReLU; maxpool: 3×3 stride 3×3; output (layer 3): 96x36x36
stage 2: convo: 7×7 stride 1×1; ReLU; maxpool: 2×2 stride 2×2; output (layer 6): 256x15x15
stage 3: convo: 3×3 stride 1×1 0-padded; ReLU; output (layer 9) 512x15x15
stage 4: convo: 3×3 stride 1×1 0-padded; ReLU; output (layer 12) 512x15x15
stage 5: convo: 3×3 stride 1×1 0-padded; ReLU; output (layer 15) 1024x15x15
stage 6: convo: 3×3 stride 1×1 0-padded; ReLU; maxpool: 3×3 stride 3×3; output (layer 19) 1024x5x5
stage 7: convo: 5×5 stride 1×1; ReLU; output (layer 21) 4096x1x1
stage 8: full; ReLU; output (layer 23) 4096x1x1
stage 9: full; output (layer 24) 1000x1x1
output stage: softmax; output (layer 25) 1000x1x1

OverFeat心得相关推荐

  1. Java EE学习心得

    –Java EE学习心得   1.    称为编程专家的秘诀是: 思考-----编程--------思考------编程--.. 编程不能一步到位,不能一上来就编,必须先思考如何写,怎样写?然后再编程 ...

  2. 测试心得:微图书销售小程序

    测试心得:微图书销售小程序 前言 这个学期差不多也将近结束,经过大半个学期,从项目需求的确认和项目文档的编写,到一步步的设计与实现,现在终于到了测试阶段,但是我们在测试阶段也暴露出了很多bug,但是每 ...

  3. java.lang.OutOfMemoryError:GC overhead limit exceeded填坑心得

    该文章出自:http://www.cnblogs.com/hucn/p/3572384.html 分析工具:http://www.blogjava.net/jjshcc/archive/2014/03 ...

  4. 计算机财务应用实验心得,计算机会计实习心得-20210628124643.doc-原创力文档

    计算机会计实习心得 计算机会计实习心得1 毕业实践环节是大学生在完成全部课程后.走向社会之前最真实的一个模拟实验,对于我们财会专业的学生,平时注意注重理论学习,缺乏实践锻炼,因此实习显得尤为重要.在本 ...

  5. html5考试总结300字,期中考心得300字5

    为了检验学生半个学期所学的知识而进行的一次考试,有利于学生比较正式地检验自己平时的学习水平,根据这个成绩,学生可以及时的调整学习心态和方法,更有效率地进行下一阶段的学习,期中考试主要考察学生前半学期的 ...

  6. Assembly学习心得

    http://blog.csdn.net/etmonitor/ Assembly学习心得 说明: 最近开始准备把学到的.NET知识重新整理一遍,眼过千遍不如手过一遍,所以我准备记下我的学习心得,已备参 ...

  7. 什么叫安装文件索引服务器,搜出精彩 玩转Windows 2008系统心得

    [IT168 专稿]不少朋友已经在不经意间与Windows Server 2008系统进行了亲密接触,在一段时间的接触之后,不知大家对该系统的文件搜索功能会有什么样的体会?其实,Windows Ser ...

  8. mysql主从数据库含义_(转)Mysql数据库主从心得整理

    管理mysql主从有2年多了,管理过200多组mysql主从,几乎涉及到各个版本的主从,本博文属于总结性的,有一部分是摘自网络,大部分是根据自己管理的心得和经验所写,整理了一下,分享给各位同行,希望对 ...

  9. 工作中InnoDB引擎数据库主从复制同步心得

    近期将公司的MySQL架构升级了,由原先的一主多从换成了DRBD+Heartbeat双主多从,正好手上有一个电子商务网站新项目也要上线了,用的是DRBD+Heartbeat双主一从,由于此过程还是有别 ...

  10. 朱晔的互联网架构实践心得S1E9:架构评审一百问和设计文档五要素

    朱晔的互联网架构实践心得S1E9:架构评审一百问和设计文档五要素 [下载文本PDF进行阅读] 本文我会来说说我认为架构评审中应该看的一些点,以及我写设计文档的一些心得.助你在架构评审中过五关斩六将,助 ...

最新文章

  1. python中execute函数_在python中函数的调用
  2. Class.getResourceAsStream和ClassLoader.getResourceAsStream方法
  3. 武科大计算机网络课程设计,【川大】计算机网络课程设计9013,奥鹏2017
  4. 【笛卡尔树】【线段树】meetings 会议(P5044)
  5. 团队项目冲刺第一阶段03
  6. IDEA报错Target Level '1.5' Is Incompatible With Source Level '1.8'
  7. echarts line
  8. asp.net mvc 生成二维码
  9. Java基础面试题,啾啾啾~~~
  10. ALSA音频框架理解:machine
  11. 向量的数量积,向量积,混合积
  12. Windows常见错误
  13. @Primary注解在spring中的使用
  14. 前言,flutter页面切换动画
  15. linux mtd 块设备,基于块设备子系统的MTD子系统(2.6.26)
  16. CSS 各类选择器 第一节
  17. Python爬虫入门心得分享
  18. C++ 语言变量的定义、声明和初始化
  19. BAPC 2019 G. Gluttonous Goop 线段树扫描线
  20. MTCNN(一)python代码训练与运行

热门文章

  1. ORACLE SQL优化大全
  2. Camtasia简单视频剪辑教程分享:实力干货
  3. 中小学python教材电子版_【python爬虫】中小学人教版教材下载实践
  4. vue的UI框架之有赞移动端vant-ui
  5. windows下桌面便签小工具简单使用技巧
  6. 使用Sophix热修复注意事项
  7. c语言对fpga编程,利用C语言对FPGA计算解决方案进行编程方法介绍
  8. Python 商务统计学 lesson 01
  9. IDEA 运行 Tomcat 中文乱码的各种问题
  10. 日常生活开支记账明细_你的理财小管家!简单明了!皮面理财记账本明细流水支出笔记本!...