[1603.09382v1] Deep Networks with Stochastic Depth (arxiv.org)

1 模型介绍

有点类似于以层为基本单元的dropout

  • 在ResNet中,有:
  • 在stochastic depth中,多了一个随机变量b
    • b的概率分布满足伯努利分布(pl的概率取1,1-pl的概率取0)
    • b=1时,即为ResNet结构;b=0时,就是一个恒等函数(残差支线没有被激活)
  • 这里p被称为“生存概率”,有两种设置方式

    • 将各层的pl设置为同样的一个值
    • 将pl设置成残差层数l的函数
      • 第0层取1的概率为1(P0=1);第L层取1的概率为PL;中间线性递减

  • 论文选择了第二种设置方式,即将线性衰减规律应用于每一层的生存概率的设置

    • 这是因为较早的层会提取低级特征,而这些低级特征会被后面的特征应用,因此前面的层不应该频繁的被丢弃

2 python实现(timm包)

from timm.models.layers import DropPathdrop_path = DropPath(0.1)###对于forward中每一层计算完后的x#####
x=drop_path(x)

机器学习笔记:随机深度网络 stochastic depth相关推荐

  1. 机器学习笔记之深度信念网络(一)背景介绍与结构表示

    机器学习笔记之深度信念网络--背景介绍与结构表示 引言 深度信念网络 场景构建 深度信念网络的联合概率分布 引言 从本节开始,将介绍深度信念网络. 深度信念网络 深度信念网络(Deep Belief ...

  2. 机器学习笔记之深度信念网络(二)模型构建思想(RBM叠加结构)

    机器学习笔记之深度信念网络--模型构建思想 引言 回顾:深度信念网络的结构表示 解析RBM隐变量的先验概率 通过模型学习隐变量的先验概率 小插曲:杰森不等式(2023/1/11) 杰森不等式的数学证明 ...

  3. 机器学习笔记之深度信念网络(三)贪心逐层预训练算法

    机器学习笔记之深度信念网络--贪心逐层预训练算法 引言 回顾:深度信念网络的结构表示 回顾: RBM \text{RBM} RBM叠加思想 贪心逐层预训练算法 引言 上一节介绍了深度信念网络模型的构建 ...

  4. 机器学习笔记之深度玻尔兹曼机(一)玻尔兹曼机系列整体介绍

    机器学习笔记之深度玻尔兹曼机--玻尔兹曼机系列整体介绍 引言 关于含隐变量模型的对数似然梯度 玻尔兹曼机 受限玻尔兹曼机 深度信念网络 深度玻尔兹曼机 引言 从本节开始,将介绍玻尔兹曼机系列的最后一个 ...

  5. 机器学习笔记之深度玻尔兹曼机(二)深度玻尔兹曼机的预训练过程

    机器学习笔记之深度玻尔兹曼机--深度玻尔兹曼机的预训练过程 引言 深度信念网络预训练过程的问题 深度玻尔兹曼机的预训练过程(2023/1/24) 引言 上一节介绍了玻尔兹曼机系列的相关模型,本节将介绍 ...

  6. 机器学习笔记之高斯网络(三)高斯马尔可夫随机场

    机器学习笔记之高斯网络--高斯马尔可夫随机场 引言 回顾:马尔可夫随机场--团.势函数 高斯马尔可夫随机场 点势函数关联的项 边势函数相关的项 关于多元高斯分布学习任务的核心思想 关于条件独立性的总结 ...

  7. [机器学习笔记]Note6--神经网络:表达

    继续是机器学习课程的笔记,这节课会介绍神经网络的内容. 非线性假设 在之前的课程中,我们看到使用非线性的多项式能够帮助我们建立更好的分类模型.假设我们有非常多的特征,例如100个变量,我们希望用这10 ...

  8. [机器学习笔记]Note7--神经网络:学习

    继续是机器学习课程的笔记,这节课会继续介绍神经网络的内容,上一节主要是基本的介绍,以及模型表示,而本节会介绍代价函数,反向传播算法等. 神经网络代价函数 首先是有如下一个神经网络,这里将首先介绍一些标 ...

  9. dnn神经网络_【李宏毅机器学习笔记】深度神经网络(DNN)

    当我们训练网络的时候,通常会出现如下两种情况: 第一种情况:训练数据表现不好,这种时候通常可以使用新的激活函数,或者调整学习率. 第二种情况:训练数据表现的很好,但是测试数据的表现很差,这个时候可以提 ...

最新文章

  1. 后端架构设计,如何扛住100亿次请求?
  2. mysql解压版怎么退出_mysql-8.0.15-winx64 解压版安装教程及退出的三种方式
  3. 剑指offer-数组中出现次数超过一半的数字
  4. AI类人工智能产品经理的丛林法则
  5. easyUI下datagrid嵌套显示
  6. mysql不被其他ip访问_mysql数据库无法被其他ip访问的解决方法
  7. 前端学习(1803):前端调试之事件伪类练习二
  8. 【C语言笔记进阶篇】第二章:字符串函数和内存函数
  9. Java 解析Excel(xls、xlsx两种格式)
  10. qiankun 传统项目配置_微前端 qiankun 项目实践
  11. 由于找不到iUtils.dll,无法继续执行代码。重新安装程序可能会解决此问题。
  12. Vscode中HTML与CSS代码的快速写法
  13. Word2Vec 与 Word Embedding的关系
  14. linux下ftp服务站点,Linux下vsftp服务建立多站点的方法
  15. pdf 模版 汉字和数字_PDF怎么添加数字签名?这款编辑器软件很多人都说好用
  16. 杨辉三角 Python(简单易懂)
  17. masscan for windows windows编译masscan
  18. android 监听连续点击,android基础之点击监听器的2种监听实现
  19. globalThis is not defined 解决方案
  20. 个人web前段学习心得

热门文章

  1. 芝诺志愿者走进养老院送温暖
  2. 小草手把手教你 LabVIEW 串口仪器控制——VISA 串口配置
  3. 金陵五题·并序 刘禹锡
  4. 贝叶斯算法-情感分类
  5. 国家发改委发布《“互联网+”高效物流实施意见》
  6. 一种基于时间滑动窗口的黑产团伙挖掘算法
  7. c++ opencv (学习笔记)inRange函数
  8. Gluster 常用操作命令
  9. 萤石云枪机球机云台接入控制实战-含源码-layui
  10. SAP案例教程FIAR应收账款后台配置