目前而言,深度学习是机器学习的发展前沿,一般针对大数据量的学习目标。其优化方法来源于基本的机器学习的优化方法,但也有所不同。

下面,小结一下,其基础是随机梯度下降的方法,但是为了学习的自适应性,做了如下改进:1. 因为每次训练的数据不一样,可能导致目标函数的梯度变化剧烈,为了解决这个问题,联合上次迭代的梯度和当前梯度,使梯度变化变缓(指数衰减);2. 在学习过程中,当迭代结果接近最优值时,我们需要学习率(即步长)越来越小,去逼近最优值,要不然会出现震荡情况导致网络不收敛。为了解决这个问题,引入学习率自适应减小机制。

参考资料:

1) Ruder, An overview of gradient descent optimization algorithms http://sebastianruder.com/optimizing-gradient-descent/index.html#gradientdescentoptimizationalgorithms
2) https://climin.readthedocs.org/en/latest/#optimizer-overview
3) Schaul, Antonoglou, Silver, Unit Tests for Stochastic Optimization
4) Sutskever, Martens, Dahl, and Hinton, “On the importance of initialization and momentum in deep learning” (ICML 2013)
5) Dyer, “Notes on AdaGrad”
6) Duchi, Hazan, and Singer, “Adaptive Subgradient Methods for Online Learning and Stochastic Optimization” (COLT 2010)
7) Hinton, Srivastava, and Swersky, “rmsprop: Divide the gradient by a running average of its recent magnitude”
8) Dauphin, Vries, Chung and Bengion, “RMSProp and equilibrated adaptive learning rates for non-convex optimization”
9) Graves, “Generating Sequences with Recurrent Neural Networks”
10) Zeiler, “Adadelta: An Adaptive Learning Rate Method”
11) Kingma and Ba, “Adam: A Method for Stochastic Optimization”

12)http://colinraffel.com/wiki/stochastic_optimization_techniques

浅析深度学习中优化方法相关推荐

  1. 浅析深度学习中Batch Size大小对训练过程的影响

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者丨陈志远@知乎(已授权) 来源丨https://zhuanlan ...

  2. 浅析深度学习中的mask操作

    mask(掩码.掩膜)是深度学习中的常见操作.简单而言,其相当于在原始张量上盖上一层掩膜,从而屏蔽或选择一些特定元素,因此常用于构建张量的过滤器(见下图). 按照上述定义,非线性激活函数Relu(根据 ...

  3. 任奎:人工智能算法安全浅析——深度学习中的对抗攻击与防御

    2020-05-19 19:52:46 任奎 随着计算机产业发展带来的计算性能与处理能力的大幅提高,人工智能在音视频识别.自然语言处理和博弈论等领域得到了广泛应用.在此背景下,确保人工智能的核心--深 ...

  4. introduction to deep learning--week1简单线性回归、梯度下降、模型正则化、和深度学习中的优化方法

    进阶课程需要一些基础知识: 1.机器学习基础知识 2.概率论知识 3.线性代数和微积分 4.python编程 我们需要知道的机器学习基础知识: 1.线性回归:均方误差(MSE).解析解 2.逻辑回归: ...

  5. 深度学习中的优化方法总结

    转载自:https://blog.csdn.net/u012151283/article/details/78154917 梯度下降沿着整个训练集的梯度方向下降.可以使用随机梯度下降很大程度地加速,沿 ...

  6. 深度学习中的优化算法之MBGD

    之前在https://blog.csdn.net/fengbingchun/article/details/75351323 介绍过梯度下降,常见的梯度下降有三种形式:BGD.SGD.MBGD,它们的 ...

  7. 深度学习中的优化算法之BGD

    之前在https://blog.csdn.net/fengbingchun/article/details/75351323 介绍过梯度下降,常见的梯度下降有三种形式:BGD.SGD.MBGD,它们的 ...

  8. 深度学习中的优化简介

    深度学习算法在许多情况下都涉及到优化. 1. 学习和纯优化有什么不同 在大多数机器学习问题中,我们关注某些性能度量P,其定义于测试集上并且可能是不可解的.因此,我们只是间接地优化P.我们系统通过降低代 ...

  9. 深度学习中的优化算法与实现

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 GiantPandaCV导语:这篇文章的内容主要是参考 沐神的mxnet/gluon视频中,Aston ...

最新文章

  1. go语言的defer语句
  2. JFreeChart插件使用
  3. 三轴联动c语言算法,(数控加工)虚拟轴数控机床的仿三轴控制.pdf
  4. python一个富翁试图与陌生人做一笔生意_VB实验报告一
  5. Java死锁故障排除和解决
  6. java和c++的区别大吗_大空间消防水炮ZDMS0.8/30S坐装和吊装有区别吗?
  7. java多线程打印helloworld,Java并发编程--多线程之HelloWorld
  8. 【java】Java实现单向链表反转
  9. 比特币白皮书 Bitcoin: A Peer-to-Peer Electronic Cash System
  10. HEVC码流简单分析
  11. 《我也能做CTO之程序员职业规划》之十:程序员职业规划就像软件工程
  12. LAMP环境搭建教程(转载)——实际安装,可用
  13. 决策树系列(三)——ID3
  14. 代数拓扑1|单纯同调
  15. matlab中.mat文件用法
  16. STM32f103系列各个型号芯片之间的程序移植
  17. 学习OpenCV:滤镜系列(8)——素描
  18. fastjson转换json字符串key的首字母小写变大写的解决办法
  19. SQL注入:搜索型注入
  20. Unity实战之王者荣耀段位计算

热门文章

  1. linux 网络监测工具
  2. 字节面试杂谈——MySQL、Redis
  3. FC按键修改教程之一键开关
  4. leetcode中的一些骚操作
  5. 潍坊OA:通达OA 2015版正式发布
  6. android 加载动画素材,八种APP启动界面的Loading进度条设计动效方案
  7. EasyNVR无插件IPC摄像机直播方案前端构建之:区分页面是自跳转还是分享依据
  8. vue生成二维码图片并且下载图片到本地
  9. 【转载】 恢复百度云同步盘本地误删的文件(2篇)
  10. 简单的电源隔离和信号地,电源地的处理