在看过一些基本资料之后进行的小总结
大佬绕道

1、残差的数学概念

是指估计值与实际值直接的差,如果存在一个映射f(x)=b,x=x0时,则b-f(x0)则为残差,x-x0为误差

2、残差网络

对于传统的CNN网络,简单的增加网络的深度,容易导致梯度消失和爆炸。针对梯度消失和爆炸的解决方法一般是正则初始化(normalized initialization)和中间的正则化层(intermediate normalization layers),但是这会导致另一个问题,退化问题,随着网络层数的增加,在训练集上的准确率却饱和甚至下降了。

按照常理更深层的网络结构的解空间是包括浅层的网络结构的解空间的,也就是说深层的网络结构能够得到更优的解,性能会比浅层网络更佳。但是实际上并非如此,深层网络无论从训练误差或是测试误差来看,都有可能比浅层误差更差。

就引出了退化问题,当网络层数加深,我们的训练损失会变得更大(训练集与测试集的损失都增大,所以不是过拟合的问题),既然深层网络相比于浅层网络具有退化问题,那么是就保留深层网络的深度,同时避免退化问题。就出现了残差网络

我们在网络上经常能见到下面一个图片,就是一个简单的残差块,由残差块堆叠而成的就是残差网络。

关于残差块,网上的说法有很多,我这里从自己的角度简单理解一下,我们的输入xxx经过两层网络之后(在第二层激活层relu函数之前)的输出是F(x)F(x)F(x),但我们不能保证经过这两层网络之后是否会有信息的丢失(如果层数越多可能信息损失的越多),如果层数逐渐加上,信息的损失会导致我们无法继续后面的训练,也会影响到权重的更新,所以我们直接加上输入的xxx作为理想输出,将这个输出记为H(x)=F(x)+xH(x)=F(x)+xH(x)=F(x)+x,这样就算信息有所损失,那么至少保证的理想输出。

在这种情况下,优化问题可以看做F(x)=H(x)−xF(x)=H(x)-xF(x)=H(x)−x,令F(x)=0F(x)=0F(x)=0这样的优化较为简单,这也是残差这个叫法的由来。

也就是说,我们不需要去拟合真正的分布,我们只需要拟合在原来的输入恒等映射上修改残差F(x)F(x)F(x),最坏使得F(x)=0F(x)=0F(x)=0,就是基本没有增益。但不至于有损失

换一种理解方式也是差不多的,就不过多赘述了,从图片上帮助理解

总得来说,我们一般会在深层网络中堆叠多个残差块,保证网络深的同时(更好的提升特征提取性能,但是过深也会导致过拟合问题)解决网络的退化问题。

3、残差网络解决退化问题的原因


这里可以看看最后推荐的几个链接,b站的视频讲解说的很清晰

相关参考还可以看一下这几篇博客残差理解参考博客1、残差理解参考2、残差理解参考博客3
b站视频

深度学习基础学习-残差相关推荐

  1. 深度学习基础学习-注意力机制(计算机视觉中)

    在网上看到很多关于注意力机制的说明,下面自己总结一下.大佬绕道 下面放几个文章的链接 添深度学习中的注意力模型 计算机视觉中的注意力机制 图像处理注意力机制Attention汇总 注意力机制详述 注意 ...

  2. 深度学习基础学习-1x1卷积核的作用(CNN中)

    前言 这里就不赘述卷积神经网络相关内容了,直接通过博主看的一些资料,自己进行了一些整合,大佬绕道. 对于1x1卷积核的作用主要可以归纳为以下几点 增加网络深度(增加非线性映射次数) 升维/降维 跨通道 ...

  3. Android开发学习——基础学习

    在微信公众号上,发现一个自学android的一个文章,觉得不错.对其进行小小总结,整理给大家. 1. 基础UI学习 Button/TextView/EditText/CheckBox/ImageVie ...

  4. 【完结】有三AI阿里云的深度学习基础课程暂时完结,欢迎扩散学习

    2021年3月份有三AI与阿里天池联合推出了深度学习系列课程, 课程内容包括人工智能与深度学习发展背景,深度学习典型应用,卷积神经网络,循环神经网络,生成对抗网络,深度学习开源框架等内容,目前已经基本 ...

  5. 深度学习(01)-- 基础学习

    文章目录 目录 1. 深度学习基础 1.1 深度学习总览 1.2 深度网络训练过程 1.2.1 传统神经网络的训练方法为什么不能用在深度神经网络 1.2.2 deep learning训练过程 1.3 ...

  6. Deep learning with python notebooks 笔记 第一章 深度学习基础

    第一章 深度学习基础 好的图表比文字传达的信息量多 图1-1帮助理清了人工智能.机器学习和深度学习之间的关系. 图1-2 清晰的阐述了经典程序设计范式和机器学习一种新的编程范式的不同.两种范式引出了两 ...

  7. 深度学习基础 | 超详细逐步图解 Transformer

    作者 | Chilia 整理 | NewBeeNLP 首先,请阅读先修知识: 深度学习基础 | 从Language Model到RNN 深度学习基础 | RNN家族全面解析 深度学习基础 | Seq2 ...

  8. 深度学习基础笔记(MLP+CNN+RNN+Transformer等等)

    提示:本人还在学习当中,所作笔记仅供大家参考,若有问题欢迎大家指出! 目录 专业词汇 基础神经网络 感知机 多层感知机MLP 卷积神经网络CNN 激活函数 正则化 最优化方法 生成模型GAN 自然语言 ...

  9. 2023双非计算机硕士应战秋招算法岗之深度学习基础知识

    word版资料自取链接: 链接:https://pan.baidu.com/s/1H5ZMcUq-V7fxFxb5ObiktQ 提取码:kadm 卷积层 全连接神经网络需要非常多的计算资源才能支撑它来 ...

  10. 资源 | Intel发布AI免费系列课程3部曲:机器学习基础、深度学习基础以及TensorFlow基础

    翻译 | AI科技大本营(公众号ID:rgznai100) 校对 | 成龙 编辑 | 明明 Intel于近期发布了三门AI系列的免费课程,分别是关于机器学习基础.深度学习基础.TensorFlow基础 ...

最新文章

  1. DateTime.Ticks 属性
  2. 综合应用WPF/WCF/WF/LINQ之三:采用用代码创建的方式实现CheckListBox的CustomControl
  3. 利用WPF建立自己的3d gis软件(非axhost方式)(五)在鼠标点击的位置增加UI
  4. 解决Jsp与Java后台之间url传值中文乱码问题
  5. 阿里云分布式缓存OCS与DB之间的数据一致性
  6. openerp mac os 下 报表中文乱码问题。
  7. python 菜单 阻塞 其它程序_Python subprocess.call阻塞
  8. oracle 查询表里信息_查看ORACLE 数据库及表信息
  9. 智能指针auto_ptr管理单例
  10. UnityShader11:纹理属性
  11. 1.简述计算机硬盘如何保养,电脑硬盘的保养知识
  12. loadrunner11破解技巧
  13. 算法课 - 最大流问题
  14. 学业水平测试计算机知识点,2021高中学业水平考试信息技术知识点
  15. ArcGIS应用(十六)Arcgis 点对连线制作航空线路图
  16. IDEA如何集成P3C插件检测代码
  17. 轮播图展示与轮播图管理
  18. IB数学HL/SL考试大纲简单介绍
  19. 一个女大学生骂她男朋友的话,厉害,没一个脏字
  20. hss网元 java,EPC网络中网元HSS的英文全称是()。

热门文章

  1. THinkphp教程网址
  2. gtx1050ti最稳定的驱动_英伟达gtx1050ti现在用什么版本驱动比较好?
  3. 此时流泪,彼时花开。。。。
  4. 无盘服务器怎么安装驱动,无盘网吧的摄像头驱动安装的解决方案
  5. SUSE Linux 15 If ‘netstat‘ is not a typo you can use command-not-found to lookup the package...
  6. 如何把一个app导入另一个app?教你快速解决!
  7. 嵌入式技术学习路线摘要
  8. Linux征途服务端启动,linux征途之系统开机流程
  9. 独角兽微盟的“AB面”
  10. 魔兽世界怀旧服务器无限刷怪点,魔兽世界怀旧服:4处无限刷新的打怪点!升级比血色站桩还快!...