2012-ImageNet数据集冠军AlexNet论文英文原文及AlexNet分析
最近几个月来一直在研究卷积神经网络,主要是应用开源框架TensorFlow对网络进行训练,训练时是根据自己对卷积神经网络的理解,自己构建的网络结构,一直没有想过应用那些在ImageNet数据竞赛中,获得冠军的网络,这几天突然想自己写下AlexNet网络的代码,在网上找到了Alex Krizhevsky的论文原文,在这里分享一下,网盘链接:http://pan.baidu.com/s/1boSo0wB 密码:pd6u
关于AlexNet网上有很多,在这里也说一下自己对AlexNet的见解:
1. 不得不承认,AlexNet掀起了深度学习热。
在2012年之前众多学者都对深度学习抱以迟疑的态度,感觉就只是理论上说的很好,但对其效果不敢恭维,Hinton为了回应网上的质疑,让其学生Alex应用卷积神经网络参加ImageNet数据大赛,结果大获全胜,从此开创了深度神经网络空前的高潮。
2. AlexNet并不是第一个应用最成功的卷积神经网络。
在AlexNet之前还有LeCun大牛在1989年提出的LeNet-5,其在当时也相当成功,被用在当时手写支票数字的识别上。时隔20多年,经过Hinton等人的不懈努力,才成就了当前深度学习算法的巨大成功。
3. 关于AlexNet
AlexNet较20多年前的LeNet-5有众多新思想,包括数据增强、局部归一化、激活函数采用ReLU、DropOut方法等。当时在斯坦福大学CS231n课程上,李飞飞的得意门生讲到数据增强很简单,也很好用,所以要常用,感兴趣的可以在查看课程(链接:http://study.163.com/course/courseLearn.htm?courseId=1003223001#/learn/video?lessonId=1004255298&courseId=1003223001)。其它比如网络深度增加、训练算法采用逐层预训练算法等也就不多说了。
AlexNet共有八层网络,其结构如下:
卷积层1:输入224*224*3 卷积核11*11*3*96 步长为4 然后是ReLU 、局部归一化 、3*3步长为2的最大值池化
卷积层2:输入28*28*96 卷积核5*5*96*256 然后是ReLU、局部归一化、3*3步长为2的最大值池化
卷积层3:输入14*14*256 卷积核3*3*256*384 然后是ReLU
卷积层4:输入14*14*384 卷积 核3*3*384*384 然后是ReLU
卷积层5:输入14*14*384 卷积核3*3*384*256 然后是ReLU、3*3步长为2的最大值池化
全连接层1:输入7*7*256 输出4096 然后是ReLU、DropOut
全连接层2:输入4096 输出4096 然后是ReLU、DropOut
全连接层3:输入4096 输出1000
注:上述各个层图片的大小是我编程计算出来的,可能和笔算的不太一样,在程序输入里图片大小采用的是224*224*3,TensorFlow的padding方式 均为'SAME'。
另外,资料都说,卷积层1输入应为227*227*3,不然算不对;在最大值池化上,有的资料采用的是2*2的最大值池化。
2012-ImageNet数据集冠军AlexNet论文英文原文及AlexNet分析相关推荐
- AlexNet论文翻译《ImageNet Classification with Deep Convolutional Neural Networks》
摘要 我们训练了一个大型深度卷积神经网络来将ImageNet LSVRC-2010竞赛的120万高分辨率的图像分到1000不同的类别中.在测试数据上,我们得到了top-1 37.5%, top-5 1 ...
- AlexNet论文翻译(中英文对照版)-ImageNet Classification with Deep Convolutional Neural Networks
图像分类经典论文翻译汇总:[翻译汇总] 翻译pdf文件下载:[下载地址] 此版为中英文对照版,纯中文版请稳步:[AlexNet纯中文版] ImageNet Classification with De ...
- ImageNet 历届冠军最新评析:哪个深度学习模型最适合你?
原文链接: https://mp.weixin.qq.com/s/I5XgYrPCCGyfV2qTI0sJhQ 深度神经网络自出现以来,已经成为计算机视觉领域一项举足轻重的技术.其中,ImageNet ...
- 计算机视觉:基于眼疾分类数据集iChallenge-PM图像分类经典模型剖析(LeNet,AlexNet,VGG,GoogLeNet,ResNet)
计算机视觉:图像分类经典模型 LeNet AlexNet VGG GoogLeNet ResNet 图像分类是根据图像的语义信息对不同类别图像进行区分,是计算机视觉的核心,是物体检测.图像分割.物体跟 ...
- ImageNet数据集简介与下载详细步骤
ImagNet与ILSVRC简介 ImageNet是一种数据集,而不是神经网络模型.斯坦福大学教授李飞飞为了解决机器学习中过拟合和泛化的问题而牵头构建的数据集.该数据集从2007年开始手机建立, ...
- 干货 | ImageNet 历届冠军架构最新评析:哪个深度学习网络最适合你(转)
转自:新智元 论文来自:An Analysis of Deep Neural Network Models for Practical Applications [导读]计算机图像计算水平稳步的增长, ...
- 【干货】ImageNet 历届冠军最新评析:哪个深度学习模型最适合你?
点击上方"深度学习与计算机视觉",选择"置顶公众号" 精品文章,第一时间送达 转载自:新智元,未经允许不得二次转载 [导读]ImageNet 图像分类竞赛极大地 ...
- 人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载...
人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载 ImageNet挑战赛中超越人类的计算机视觉系统 微软亚洲研究院视觉计算组基于深度卷积神经网络(CNN)的 ...
- ImageNet历年冠军模型
ImageNet 是一个超过15 million的图像数据集,大约有22,000类. 是由李飞飞团队从2007年开始,耗费大量人力,通过各种方式(网络抓取,人工标注,亚马逊众包平台)收集制作而成,它作 ...
最新文章
- 参观云栖小镇体会_我院留学生赴云栖小镇参观学习
- python爬虫实际应用_如何使用python爬虫论坛?
- linux 配置java环境
- Pandas 文本数据方法 capitalize( ) lower( ) upper( )
- java.lang.IllegalArgumentException: Request header is too large的解决方法
- 【数据结构笔记46】Sort with Swap(0,*)只允许交换0的排序
- python 检查代码规范_Python代码规范检测
- 从SQL Server中导入/导出 Excel 的基本方法
- 跟公司妹子交流了一下
- 超详细三维建模教程【小白专用】
- 如何使用Git SVN工具 -- TortoiseGit(小乌龟)将本地项目上传至GitEE?【超详细教程】
- xy轴坐标图数字表示_求坐标x轴、y轴公式-x轴y轴-数学-潘遮驴同学
- 常用的邮箱有哪些,可用好用的邮箱大全推荐
- 二层、三层、四层交换机、路由器的区别
- 在html文字下标标记,在HTML中,下面( )标记可将所修饰的文本显示为下标。(选一项)...
- 天融信防火墙保存配置_天融信防火墙配置备份 飞塔防火墙配置手册
- Snipaste截图界大咖
- 数字分解的套路与陷阱
- Java是剑客-飘逸;.NET是刀客-霸道
- 大屏幕led无缝拼接显示屏的十大技术优势
热门文章
- 15 ArcGIS JS API 4.17更改测量控件黄白相间的默认样式
- 扫码支付吃个煎饼,街边摊支付的背后也要有大数据运营
- linux系统log可以删吗,Linux 系统 /var/log/journal/ 垃圾日志清理
- 深度分析Palantir的投资价值,Palantir2023年将实现强劲反弹?
- 在ABAP的SQL语句中写Oracle Hints
- PHP 按城市名获取首字母并且分组排序
- 操作系统:操作系统的概念
- 2021江西高考成绩查询入口已开通,2021年江西省高考成绩查询系统入口【官网】...
- TF-IDF算法:用 Python 提炼财经新闻
- Android的图片缓存处理