2015 深度学习文章整理
国内外从事计算机视觉和图像处理相关领域的著名学者都以在三大顶级会议(ICCV,CVPR和ECCV)上发表论文为荣,其影响力远胜于一般SCI期刊论文,这三大顶级学术会议论文也引领着未来的研究趋势。CVPR是主要的计算机视觉会议,可以把它看作是计算机视觉研究的奥林匹克。博主今天先来整理CVPR2015年的精彩文章(这个就够很长一段时间消化的了)
顶级会议CVPR2015参会paper网址:
http://www.cv-foundation.org/openaccess/CVPR2015.py
来吧,一项项的开始整理,总有你需要的文章在等你!
CNN Architectures
CNN网络结构:
1.Hypercolumns for Object Segmentation and Fine-Grained Localization
Authors: Bharath Hariharan, Pablo Arbeláez, Ross Girshick, Jitendra Malik
2.Modeling Local and Global Deformations in Deep Learning: Epitomic Convolution, Multiple Instance Learning, and Sliding Window Detection
Authors: George Papandreou, Iasonas Kokkinos, Pierre-André Savalle
3.Going Deeper With Convolutions
Authors: Christian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke, Andrew Rabinovich
这篇文章推荐一下,使用了《network in network》中的用 global averaging pooling layer 替代 fully-connected layer的思想。有看过的可以私信博主,一起讨论文章心得。
4.Improving Object Detection With Deep Convolutional Networks via Bayesian Optimization and Structured Prediction
Authors: Yuting Zhang, Kihyuk Sohn, Ruben Villegas, Gang Pan, Honglak Lee
5.Deep Neural Networks Are Easily Fooled: High Confidence Predictions for Unrecognizable Images
Authors: Anh Nguyen, Jason Yosinski, Jeff Clune
Action and Event Recognition
1.Deeply Learned Attributes for Crowded Scene Understanding
Authors: Jing Shao, Kai Kang, Chen Change Loy, Xiaogang Wang
2.Modeling Video Evolution for Action Recognition
Authors: Basura Fernando, Efstratios Gavves, José Oramas M., Amir Ghodrati, Tinne Tuytelaars
3.Joint Inference of Groups, Events and Human Roles in Aerial Videos
Authors: Tianmin Shu, Dan Xie, Brandon Rothrock, Sinisa Todorovic, Song Chun Zhu
Segmentation in Images and Video
1.Causal Video Object Segmentation From Persistence of Occlusions
Authors: Brian Taylor, Vasiliy Karasev, Stefano Soatto
2.Fully Convolutional Networks for Semantic Segmentation
Authors: Jonathan Long, Evan Shelhamer, Trevor Darrell
——文章把全连接层当做卷积层,也用来输出featuremap。这样相比Hypercolumns/HED 这样的模型,可迁移的模型层数(指VGG16/Alexnet等)就更多了。但是从文章来看,因为纯卷积嘛,所以featuremap的每个点之间没有位置信息的区分。相较于Hypercolumns的claim,鼻子的点出现在图像的上半部分可以划分为pedestrian类的像素,但是如果出现在下方就应该划分为背景。所以位置信息应该是挺重要需要考虑的。这也许是速度与性能的trade-off?
3.Is object localization for free - Weakly-supervised learning with convolutional neural networks
——弱监督做object detection的文章。首先fc layer当做conv layer与上面这篇文章思想一致。同时把最后max pooling之前的feature map看做包含class localization的信息,只不过从第五章“Does adding object-level supervision help classification”的结果看,效果虽好,但是这一物理解释可能不够完善。
4.Shape-Tailored Local Descriptors and Their Application to Segmentation and Tracking
Authors: Naeemullah Khan, Marei Algarni, Anthony Yezzi, Ganesh Sundaramoorthi
5.Deep Filter Banks for Texture Recognition and Segmentation
Authors: Mircea Cimpoi, Subhransu Maji, Andrea Vedaldi
6.Deeply learned face representations are sparse, selective, and robust, Yi Sun, Xiaogang Wang, Xiaoou Tang
——DeepID系列之DeepID2+。在DeepID2之上的改进是增加了网络的规模(feature map数目),另外每一层都接入一个全连通层加supervision。最精彩的地方应该是后面对神经元性能的分析,发现了三个特点:1.中度稀疏最大化了区分性,并适合二值化;2.身份和attribute选择性;3.对遮挡的鲁棒性。这三个特点在模型训练时都没有显示或隐含地强加了约束,都是CNN自己学的。
Image and Video Processing and Restoration
1.Fast and Flexible Convolutional Sparse Coding
Authors: Felix Heide, Wolfgang Heidrich, Gordon Wetzstein
2.What do 15,000 Object Categories Tell Us About Classifying and Localizing Actions?
Authors: Mihir Jain, Jan C. van Gemert, Cees G. M. Snoek
——物品的分类对行为检测有帮助作用。这篇文章是第一篇关于这个话题进行探讨的,是个深坑,大家可以关注一下,考虑占坑。
3.Hypercolumns for Object Segmentation and Fine-Grained Localization
Authors:Bharath Hariharan, Pablo Arbeláez, Ross Girshick, Jitendra Malik
——一个很好的思路!以前的CNN或者R-CNN,我们总是用最后一层作为class label,倒数第二层作为feature。这篇文章的作者想到利用每一层的信息。因为对于每一个pixel来讲,在所有层数上它都有被激发和不被激发两种态,作者利用了每一层的激发态作为一个feature vector来帮助自己做精细的物体检测。
3D Models and Images
1.The Stitched Puppet: A Graphical Model of 3D Human Shape and Pose
Authors: Silvia Zuffi, Michael J. Black
2.3D Shape Estimation From 2D Landmarks: A Convex Relaxation Approach
Authors: Xiaowei Zhou, Spyridon Leonardos, Xiaoyan Hu, Kostas Daniilidis
Images and Language
这个类别的文章需要好好看看,对思路的发散很有帮助
1.Show and Tell: A Neural Image Caption Generator
Authors: Oriol Vinyals, Alexander Toshev, Samy Bengio, Dumitru Erhan
2.Deep Visual-Semantic Alignments for Generating Image Descriptions
Authors: Andrej Karpathy, Li Fei-Fei
3.Long-Term Recurrent Convolutional Networks for Visual Recognition and Description
Authors: Jeffrey Donahue, Lisa Anne Hendricks, Sergio Guadarrama, Marcus Rohrbach, Subhashini Venugopalan, Kate Saenko, Trevor Darrell
4.Becoming the Expert - Interactive Multi-Class Machine Teaching
Authors: Edward Johns, Oisin Mac Aodha, Gabriel J. Brostow
其它
参考文献一:CNN卷积神经网络的改进(15年最新paper):
http://blog.csdn.net/u010402786/article/details/50499864
文章中的四篇文章也值得一读,其中一篇在上面出现过。一定要自己下载下来看一看。
参考文献二:这是另外一个博主的博客,也是对CVPR的文章进行了整理:
http://blog.csdn.net/jwh_bupt/article/details/46916653
基本许多文章里面没有注释核心思想,接下来慢慢补充。2016-01-20
2015 深度学习文章整理相关推荐
- CVPR 2015深度学习回顾
CVPR 2015深度学习回顾:ConvNet.Caffe.Torch及其他 width="22" height="16" src="http: ...
- 深度学习资料整理(软件资源)
近这两年里deep learning技术在图像识别和跟踪等方面有很大的突破,是一大研究热点,里面涉及的数学理论和应用技术很值得深入研究,这系列博客总结了深度学习的博客,原理等资料,供大家学习讨论. 一 ...
- 真·干货!这套深度学习教程整理走红,从理论到实践的带你系统学习 | 资源...
铜灵 发自 凹非寺 量子位 出品 | 公众号 QbitAI 寒假/春节小长假给自己充电的真·干货来了. 如果你想要的是一份从理论到实践的深度学习教程清单,如果你想系统了解各类框架.基础网络与各种使用场 ...
- 深度学习常见问题整理
问题列表 如何设置网络的初始值?* 梯度爆炸的解决办法*** 神经网络(MLP)的万能近似定理* 神经网络中,深度与宽度的关系,及其表示能力的差异** 在深度神经网络中,引入了隐藏层(非线性单元),放 ...
- 【干货小铺】各种编程语言的深度学习库整理
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达本文转自|新机器视觉 本文总结了Python.Matlab.CPP. ...
- 各种编程语言的深度学习库整理
Python 1. Theano是一个python类库,用数组向量来定义和计算数学表达式.它使得在Python环境下编写深度学习算法变得简单.在它基础之上还搭建了许多类库. 1.Keras是一个简洁. ...
- 【深度学习问题整理】
一.梯度消失和梯度爆炸 1.参考 https://blog.csdn.net/qq_25737169/article/details/78847691 2.概念: 在深度神经网络中,通常采用BP方法更 ...
- 各种编程语言的深度学习库整理(中英版)
本文总结了Python.Matlab.CPP.Java.JavaScript.Lua.Julia.Lisp.Haskell..NET.R等语言的深度学习库,赶紧收藏吧! Python 1. Thean ...
- 机器学习和深度学习资料整理
理论入门(里面的程序有些问题,但理论讲得挺好的) https://www.zybuluo.com/hanbingtao/note/476663 tensorflow编程入门 https://githu ...
最新文章
- 灵活运用ISA的链接转换功能:ISA2006系列之十三
- splunk rest api search
- 利用Nginx轻松实现Ajax的跨域请求(前后端分离开发调试必备神技)
- 注册表修改之USB口启用
- 成功解决cv2.error: OpenCV(4.1.2) /io/opencv/modules/imgproc/src/color.cpp:182: error: (-215:Assertion fa
- pytorch无法下载或下载缓慢问题
- 使用 create-react-app 构建 react应用程序
- 在使用 ADO.NET 导出 Excel 文件时,设置 IMEX=1 仍不能导出所有数据的解决办法
- C语言学习趣事_你不知道的C语言应用
- c语言禁止优化某段代码,C语言优化小技巧
- 信号和通信系统第三版(PDF)
- Linux转发性能评估与优化 转发瓶颈分析与解决方案
- 【MyBatis笔记-09】MyBatis-Plus的使用
- Excel-VBA 快速上手(四、Excel 程序事件、工作簿事件、工作表事件)
- java工程师容易秃头吗_程序员因发际线后悔学java!
- 【Unity3D开发小游戏】《超级马里奥游戏》Unity开发教程
- Android Studio 实现视频播放暂停功能
- onlyoffice 自动保存_onlyoffice服务在线编辑文档保存解析
- flowable相关的一些名词说明
- 微博登录界面的PHP代码,redis+php实现微博(一)注册与登录功能详解
热门文章
- python飞机大战简书_python中的小游戏——飞机大战
- 需求调研计划_拆书营销管理 实施营销调研和预测需求
- 华清远见智能小车视频服务器,华清远见版世界杯足球对抗赛,智能小车C位出道...
- 源码阅读之Java栈的实现
- Hyper-V 配置网络 (高级篇)
- 阿里云ubuntu14.04下lamp环境搭建の备忘
- HDU ACM 1267 下沙的沙子有几粒?-gt;DP
- J2EE (六) 详解 java 中文乱码
- DB2数据导入导出的小结
- Linux系统下MBR分区表的备份与恢复