2012－ImageNet数据集冠军AlexNet论文英文原文及AlexNet分析

最近几个月来一直在研究卷积神经网络，主要是应用开源框架TensorFlow对网络进行训练，训练时是根据自己对卷积神经网络的理解，自己构建的网络结构，一直没有想过应用那些在ImageNet数据竞赛中，获得冠军的网络，这几天突然想自己写下AlexNet网络的代码，在网上找到了Alex Krizhevsky的论文原文，在这里分享一下，网盘链接：http://pan.baidu.com/s/1boSo0wB 密码：pd6u

关于AlexNet网上有很多，在这里也说一下自己对AlexNet的见解：

1. 不得不承认，AlexNet掀起了深度学习热。

在2012年之前众多学者都对深度学习抱以迟疑的态度，感觉就只是理论上说的很好，但对其效果不敢恭维，Hinton为了回应网上的质疑，让其学生Alex应用卷积神经网络参加ImageNet数据大赛，结果大获全胜，从此开创了深度神经网络空前的高潮。

2. AlexNet并不是第一个应用最成功的卷积神经网络。

在AlexNet之前还有LeCun大牛在1989年提出的LeNet-5，其在当时也相当成功，被用在当时手写支票数字的识别上。时隔20多年，经过Hinton等人的不懈努力，才成就了当前深度学习算法的巨大成功。

3. 关于AlexNet

AlexNet较20多年前的LeNet-5有众多新思想，包括数据增强、局部归一化、激活函数采用ReLU、DropOut方法等。当时在斯坦福大学CS231n课程上，李飞飞的得意门生讲到数据增强很简单，也很好用，所以要常用，感兴趣的可以在查看课程(链接：http://study.163.com/course/courseLearn.htm?courseId=1003223001#/learn/video?lessonId=1004255298&courseId=1003223001)。其它比如网络深度增加、训练算法采用逐层预训练算法等也就不多说了。

AlexNet共有八层网络，其结构如下：

卷积层1：输入224*224*3 卷积核11*11*3*96 步长为4 然后是ReLU 、局部归一化、3*3步长为2的最大值池化

卷积层2：输入28*28*96 卷积核5*5*96*256 然后是ReLU、局部归一化、3*3步长为2的最大值池化

卷积层3：输入14*14*256 卷积核3*3*256*384 然后是ReLU

卷积层4：输入14*14*384 卷积核3*3*384*384 然后是ReLU

卷积层5：输入14*14*384 卷积核3*3*384*256 然后是ReLU、3*3步长为2的最大值池化

全连接层1：输入7*7*256 输出4096 然后是ReLU、DropOut

全连接层2：输入4096 输出4096 然后是ReLU、DropOut

全连接层3：输入4096 输出1000

注：上述各个层图片的大小是我编程计算出来的，可能和笔算的不太一样，在程序输入里图片大小采用的是224*224*3，TensorFlow的padding方式均为'SAME'。

另外，资料都说，卷积层1输入应为227*227*3，不然算不对；在最大值池化上，有的资料采用的是2*2的最大值池化。

2012－ImageNet数据集冠军AlexNet论文英文原文及AlexNet分析相关推荐

AlexNet论文翻译《ImageNet Classification with Deep Convolutional Neural Networks》
摘要我们训练了一个大型深度卷积神经网络来将ImageNet LSVRC-2010竞赛的120万高分辨率的图像分到1000不同的类别中.在测试数据上,我们得到了top-1 37.5%, top-5 1 ...
AlexNet论文翻译（中英文对照版）-ImageNet Classification with Deep Convolutional Neural Networks
图像分类经典论文翻译汇总:[翻译汇总] 翻译pdf文件下载:[下载地址] 此版为中英文对照版,纯中文版请稳步:[AlexNet纯中文版] ImageNet Classification with De ...
ImageNet 历届冠军最新评析：哪个深度学习模型最适合你？
原文链接: https://mp.weixin.qq.com/s/I5XgYrPCCGyfV2qTI0sJhQ 深度神经网络自出现以来,已经成为计算机视觉领域一项举足轻重的技术.其中,ImageNet ...
计算机视觉：基于眼疾分类数据集iChallenge-PM图像分类经典模型剖析(LeNet,AlexNet,VGG,GoogLeNet,ResNet)
计算机视觉:图像分类经典模型 LeNet AlexNet VGG GoogLeNet ResNet 图像分类是根据图像的语义信息对不同类别图像进行区分,是计算机视觉的核心,是物体检测.图像分割.物体跟 ...
ImageNet数据集简介与下载详细步骤
ImagNet与ILSVRC简介 ImageNet是一种数据集,而不是神经网络模型.斯坦福大学教授李飞飞为了解决机器学习中过拟合和泛化的问题而牵头构建的数据集.该数据集从2007年开始手机建立, ...
干货 | ImageNet 历届冠军架构最新评析：哪个深度学习网络最适合你（转）
转自:新智元论文来自:An Analysis of Deep Neural Network Models for Practical Applications [导读]计算机图像计算水平稳步的增长, ...
【干货】ImageNet 历届冠军最新评析：哪个深度学习模型最适合你？
点击上方"深度学习与计算机视觉",选择"置顶公众号" 精品文章,第一时间送达转载自:新智元,未经允许不得二次转载 [导读]ImageNet 图像分类竞赛极大地 ...
人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载...
人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载 ImageNet挑战赛中超越人类的计算机视觉系统微软亚洲研究院视觉计算组基于深度卷积神经网络(CNN)的 ...
ImageNet历年冠军模型
ImageNet 是一个超过15 million的图像数据集,大约有22,000类. 是由李飞飞团队从2007年开始,耗费大量人力,通过各种方式(网络抓取,人工标注,亚马逊众包平台)收集制作而成,它作 ...

2012－ImageNet数据集冠军AlexNet论文英文原文及AlexNet分析

2012－ImageNet数据集冠军AlexNet论文英文原文及AlexNet分析相关推荐

最新文章

热门文章