AlexNet论文精读

1、paper的贡献:

训练了一个最大的神经网络，然后取得了特别好的结果
实现了GPU上性能很高的一个2D的卷积
网络有一些新的特性能够提升性能，降低模型的训练时间
使用一些方法防止过拟合，使得模型更好
模型具有5个卷积层，3个全连接层，得出深度很重要
2、数据集
对ImageNet中的图片没有做任何的预处理只是进行了简单的剪裁。当时计算机视觉都是将特征抽取出来，在之后的工作中基本上就是将原本的文本或者图片放进去不做任何的特征抽取，通过神经网络完成这部分工作。
3、结构

（1）卷积层
卷积的过程高宽慢慢变小，深度渐渐增加，随着深度的增加，慢慢地将空间信息压缩，知道最后每一个像素能够代表前面一大块的像素，然后再将通道数慢慢增加。慢慢地将空间信息压缩，语义空间信息增加，到最后卷积完成之后，进入全连接层。
（2）降低过拟合
- 数据增强
- dropout
  随机的将一些隐藏层的输出变成0，dropout在全连接层会用到
  （3）Relu非线性激活函数，Relu激活函数计算简单，不需要如sigmoid激活函数那般复杂的求幂运算。另一方面，当使用不同参数初始化方法时，ReLU激活函数使训练模型更加容易。
  （4）正则化、归一化
  （5）overlapping pooling
  （6）训练
- 使用SGD随机梯度下降来进行训练
- 批量大小为128
- momentum是0.9，当优化的表面非常不平滑的时候，冲量使得不要被当下的梯度过多的误导，可以保持一个冲量从过去那个方向沿着一个比较平缓的方向往前走，这样子比较容易陷入到局部最优解。
- 权重使用均值为0，方差为0.01的高斯随机变量来初始化
- 每个层使用同样的学习率，从0.01开始，然后呢如果验证误差不往下降了，就手动的将他乘以0.1，就是降低十倍
- 在Alex之后的很多训练里面，都是做规则性地将学习率往下下降十倍，这是一个非常主流的做法，但是现在很少用了，现在使用更加平滑的曲线来降低学习率，比如果用一个cos的函数比较平缓地往下降。现在主流的做法是学习率从0开始再慢慢上升，慢慢下降

AlexNet论文精读相关推荐

【推荐系统论文精读系列】(八)--Deep Crossing：Web-Scale Modeling without Manually Crafted Combinatorial Features
文章目录一.摘要二.介绍三.相关工作四.搜索广告五.特征表示 5.1 独立特征 5.2 组合特征六.模型架构 6.1 Embedding层 6.2 Stacking层 6.3 Residu ...
CNN基础论文精读+复现----VGG(一)
文章目录前言第1页第2-3页第四页第五页前言原文Github地址:https://github.com/shitbro6/paper/blob/main/VGG.pdf 原文arxiv地 ...
跟李沐学AI-AlexNet论文逐段精读【论文精读】
视频链接:AlexNet论文逐段精读[论文精读]_哔哩哔哩_bilibili AlexNet 1.introduction 第一段一篇论文的第一段通常是讲个故事做什么研究哪个方向这个方向有什么 ...
ViT论文逐段精读【论文精读】-跟李沐学AI
视频链接:ViT论文逐段精读[论文精读]_哔哩哔哩_bilibili ViT:过去一年,CV 最有影响力的工作推翻了 2012 Alexnet 提出的 CNN 在 CV 的统治地位有足够多的预训练 ...
CNN基础论文精读+复现----GoogleNet InceptionV1 (一)
文章目录前言第1页摘要与引言第2页文献综述第3-4页第4-5页 inception模块细节第5-7页 GoogLeNet 第8页训练细节第8-10页 ILSVRC 2014 inc ...
Vision Transformer论文精读（1/2）
目录一.大致概况二.论文精读 (1)前述 (2)摘要.引言 (3)结论 (4)相关工作三.参考链接精读论文 <AN IMAGE IS WORTH 16X16 WORDS: TRANSFO ...
Swin Transformer 论文精读，并解析其模型结构
计算机视觉的建模从AlexNet在ImageNet分类挑战的良好表现开始,然后到目标检测的SSD.RCNN.YOLO等模型,一直由CNN主导.直到NLP领域中Transformer的崛起,并经ViT应 ...
论文精读——CenterNet :Objects as Points
论文精读--CenterNet :Objects as Points 论文地址:https://arxiv.org/pdf/1904.07850.pdf 机构:UT Austin,UC Berkele ...
论文精读 | slam中姿态估计的图优化方法比较
一. 摘要对于位置环境中的自主导航问题,同步定位与建图(Simultaneous localization and mapping, SLAM)是一个非常重要的工具框架.根据SLAM字面含义可以得知 ...

AlexNet论文精读

AlexNet论文精读相关推荐

最新文章

热门文章