Dropout: A Simple Way to Prevent Neural Networks from Overfitting

  • 对于 dropout 层,在训练时节点保留率(keep probability)为某一概率 pp(0.5),在预测时(前向预测时)为 1.0

1. dropout 网络与传统网络的区别

传统网络:

  • z(ℓ+1)i=∑jw(ℓ+1)ij⋅y(ℓ)j+b(ℓ+1)i=w(ℓ+1)iy(ℓ)+b(ℓ+1)iz_{i}^{(\ell+1)}=\sum_j w_{ij}^{(\ell+1)}\cdot y_j^{(\ell)}+b_i^{(\ell+1)}=\mathbf w_i^{(\ell+1)}\mathbf y^{(\ell)}+b_i^{(\ell+1)}
    • y(ℓ+1)i=f(z(ℓ+1)i)y_i^{(\ell+1)}=f(z_{i}^{(\ell+1)})

而对于 dropout 型网络:

  • r(ℓ)j∼Bernoulli(p)r_j^{(\ell)}\sim \text{Bernoulli}(p)
  • y˜(ℓ)=r(ℓ)∗y(ℓ)\widetilde{\mathbf y}^{(\ell)}=\mathbf r^{(\ell)}* \mathbf y^{(\ell)}
  • z(ℓ+1)i=∑jw(ℓ+1)ij⋅y˜(ℓ)j+b(ℓ+1)i=w(ℓ+1)iy˜(ℓ)+b(ℓ+1)iz_{i}^{(\ell+1)}=\sum_j w_{ij}^{(\ell+1)}\cdot \widetilde y_j^{(\ell)}+b_i^{(\ell+1)}=\mathbf w_i^{(\ell+1)}\widetilde{\mathbf y}^{(\ell)}+b_i^{(\ell+1)}
  • y(ℓ+1)i=f(z(ℓ+1)i)y_i^{(\ell+1)}=f(z_{i}^{(\ell+1)})



由此可见 dropout 的应用应在 relu 等非线性激活函数之后,

-> CONV/FC -> BatchNorm -> ReLu(or other activation) -> Dropout -> CONV/FC ->;

Dropout 理论基础与实战细节相关推荐

  1. RTP载荷H265(实战细节)

    H264与H265协议详解 RTP载荷H264(实战细节) RTP载荷H265(实战细节) RTP包的结构: RTP头在 "RTP载荷H264(实战细节)"讲的很清楚了,不了解的可 ...

  2. 机器学习、深度学习实战细节(batch norm、relu、dropout 等的相对顺序)

    cost function,一般得到的是一个 scalar-value,标量值: 执行 SGD 时,是最终的 cost function 获得的 scalar-value,关于模型的参数得到的: 1. ...

  3. Keras防止过拟合(一)Dropout层源码细节

    在使用深度学习模型时,会遇到两种问题,过拟合和欠拟合.其中,解决欠拟合的方法有增大数据集,优化模型等等,根据具体问题具体对待.过拟合的问题,可以通过Dropout,添加L1,L2正规项等等很简单的方法 ...

  4. 开发实战细节之——关于整型转换为字符串类型的性能与实现分析

    细节决定成败,开发中往往从一些细节就可以看出一个程序员的开发水准,下面我就给大家分享一下开发中最最常见的int转换为String类型的方法及其性能解析. 一般大家最常用的方法有 方法一:String ...

  5. 【CV夏季划】2021年冲刺CV秋招,100余课时从理论基础到进阶实践系统掌握

    2021年的有三AI-CV夏季划已经正式发布了,并且这也是最后一届由言有三本人直接带领的夏季划小组,仅限于今年. 有三AI-CV夏季划是言有三直接一对一带领的深度学习和计算机视觉学习计划小组,目标是在 ...

  6. tornado项目搭建_Python深度学习原理及项目实战2019年3月21日上海举办

    一.课程背景 众所周知,人工智能是高级计算智能最宽泛的概念,机器学习是研究人工智能的一个工具,深度学习是机器学习的一个子集,是目前研究领域卓有成效的学习方法.深度学习的框架有很多,而TenforFlo ...

  7. 深度学习的实用层面 —— 1.7 理解Dropout

    Dropout可以随机删除网络ongoing的神经单元,它为什么可以通过正则化发挥这么大的作用呢?我们来更直观地理解一下. 在上一个视频中,我们已经对dropout随机删除网络中的神经单元有了一个直观 ...

  8. Coursera | Andrew Ng (02-week-1-1.7)—理解 Dropout

    该系列仅在原课程基础上部分知识点添加个人学习笔记,或相关推导补充等.如有错误,还请批评指教.在学习了 Andrew Ng 课程的基础上,为了更方便的查阅复习,将其整理成文字.因本人一直在学习英语,所以 ...

  9. 专访 | 商汤HPC负责人刘文志(风辰):未来战略的两大方向及招人的4个标准

    记者 | 鸽子 前不久,商汤刚刚完成了4.1亿美金的B轮融资,创下了人工智能领域最大融资金额的记录. 据业界人士透露,之所以能完成这次巨大数额融资,一方面是因为商汤的算法在整个行业处于绝对领先的地位, ...

最新文章

  1. 2020年智能车竞赛由预赛赛道拼接成决赛赛道的方案
  2. Druid 执行时间分布规则
  3. 我用python是什么梗_Python中的一些梗
  4. PyQt5 技术篇 - Qt Designer怎么用styleSheet设置按钮的背景
  5. linux 无响应_系统加固之Linux安全加固
  6. android 恢复出厂设置 时间,Android 恢复出厂设置后,时间不能恢复为:2013年1月1日...
  7. 程序猿段子_【新年新气象】今年,能为程序员男友做点什么?
  8. Android底部导航栏实现(一)之BottomNavigationBar
  9. 下载人脸认证助手_关于微信人脸解封验证失败方法
  10. 用决策树模型求解回归问题(regression tree)
  11. BZOJ 4568 幸运数字
  12. 没有自制力的人有什么资格谈努力
  13. oracle查询排序id,Oracle查询数据怎么按照甲乙丙丁排序?谢谢
  14. 强迫症的 LaTeX 学习笔记
  15. 解密保存Mac版微信聊天记录的数据库文件并导出聊天记录
  16. 二叉树的遍历(非递归)
  17. 从Github下载laravel项目遇到的坑
  18. 生鲜电商平台多方位可行性方案,如何撬开“蓝海”
  19. 浅析:S2B2C模式
  20. 单目、二目、三目运算符

热门文章

  1. .NET中加密和解密的实现方法
  2. Java复习总结(一)思维导图
  3. .sh 编译 java_build-java.sh
  4. Object类的使用,包装类的使用
  5. linux去掉日志中的skipping,Linux日志文件总管 logrotate
  6. layui totalRow 多层嵌套json_自定义 Behavior,实现嵌套滑动、平滑切换周月视图的日历...
  7. Linux基础——Linux 基本指令 ls 和 cd
  8. OpenCV精进之路(零):core组件——Mat和IplImage访问像素的方法总结
  9. 吃完饭打嗝原因及治疗方法(分享)
  10. C#首席设计师Anders Hejlsberg专访