目录

0. 前言

1. Batch gradient descent(BGD)

2. Stochastic gradient descent(SGD)

3. Mini-batch gradient descent(MBGD)


如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔~我会非常开心的~

花书+吴恩达深度学习(五)正则化方法(防止过拟合)

花书+吴恩达深度学习(六)优化方法之 Mini-batch(SGD, MBGD, BGD)

花书+吴恩达深度学习(七)优化方法之基本算法(Momentum, Nesterov, AdaGrad, RMSProp, Adam)

花书+吴恩达深度学习(八)优化方法之 Batch normalization

花书+吴恩达深度学习(九)优化方法之二阶近似方法(牛顿法, CG, BFGS, L-BFGS)

0. 前言

通常,我们定义代价函数:

其中,使用的是全部样本集  ,如果修改其数量,就会得到不同的算法。

1. Batch gradient descent(BGD)

BGD 称为批量梯度下降,就是原始的梯度下降,每次迭代使用所有的样本进行更新操作。

BGD 的优点:

  1. 每次更新的梯度估计方向直接指向收敛的最小值点,最终达到收敛点

BGD 的缺点:

  1. 数据量庞大时,每一次迭代都需要耗费很大的时间

2. Stochastic gradient descent(SGD)

SGD 称为随机梯度下降,每次迭代使用的仅仅是随机的一个样本。

SGD 的优点:

  1. 因为只有一个样本,每次更新迭代速度快
  2. 可以作为在线算法,不断使用新的数据更新参数

SGD 的缺点:

  1. 每次梯度估计方向都不确定,可能需要很长的时间接近最小值点,永远不会收敛

3. Mini-batch gradient descent(MBGD)

MBGD 称为小批量梯度下降,每次迭代使用一个以上又不是全部的样本。

MBGD 的优点:

  1. 使用多个样本相比 SGD 提高了梯度估计的精度
  2. 小批量的估计,相当于在学习过程中加入了噪声,会有一些正则化的效果

MBGD 的缺点:

  1. 同 SGD 一样,每次梯度估计的方向不确定,可能需要很长时间接近最小值点,不会收敛

通常在使用 MBGD 之前先将数据集随机打乱,然后再划分 Mini-batch,所以 MBGD 有时也称为 SGD 

Mini-batch 大小的选择通常使用 2 的幂数,可以获得更少的运行时间。

遍历完所有数据,称为一个 epoch ,通常需要遍历几次 epoch 才行。


如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔~我会非常开心的~

花书+吴恩达深度学习(六)优化方法之 Mini-batch(SGD, MBGD, BGD)相关推荐

  1. 花书+吴恩达深度学习(二六)近似推断(EM, 变分推断)

    文章目录 0. 前言 1. 将推断视为优化问题 1.1 期望最大化 EM 1.2 最大后验推断 MAP 1.3 稀疏编码 2. 变分推断 2.1 离散型潜变量 2.2 连续性潜变量 如果这篇文章对你有 ...

  2. 花书+吴恩达深度学习(十六)序列模型之双向循环网络 BRNN 和深度循环网络 Deep RNN

    目录 0. 前言 1. 双向循环网络 BRNN(Bidirectional RNN) 2. 深度循环网络 Deep RNN 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔~我会非常开心的~ 花 ...

  3. 花书+吴恩达深度学习(二五)直面配分函数(CD, SML, SM, RM, NCE)

    文章目录 0. 前言 1. 对数似然梯度 1.1 朴素 MCMC 算法 1.2 对比散度算法 CD 1.3 随机最大似然 SML 2. 伪似然 3. 得分匹配 SM 4. 比率匹配 RM 5. 去噪得 ...

  4. 花书+吴恩达深度学习(二四)蒙特卡罗方法(重要采样,MCMC)

    文章目录 0. 前言 1. 重要采样 2. 马尔可夫链蒙特卡罗 MCMC 3. 不同峰值之间的混合挑战 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~ 花书+吴恩达深度学习( ...

  5. 花书+吴恩达深度学习(二三)结构化概率模型(贝叶斯网络、马尔可夫随机场)

    文章目录 0. 前言 1. 有向模型 2. 无向模型 3. 因子图 4. 分离和d-分离 5. 从图模型中采样 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~ 花书+吴恩达深 ...

  6. 花书+吴恩达深度学习(十七)序列模型之长短期记忆 LSTM 和门控循环单元 GRU

    目录 0. 前言 1. 长短期记忆 LSTM 2. 门控循环单元 GRU 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔~我会非常开心的~ 花书+吴恩达深度学习(十五)序列模型之循环神经网络 ...

  7. 花书+吴恩达深度学习(十五)序列模型之循环神经网络 RNN

    目录 0. 前言 1. RNN 计算图 2. RNN 前向传播 3. RNN 反向传播 4. 导师驱动过程(teacher forcing) 5. 不同序列长度的 RNN 如果这篇文章对你有一点小小的 ...

  8. 花书+吴恩达深度学习(十四)卷积神经网络 CNN 之经典案例(LetNet-5, AlexNet, VGG-16, ResNet, Inception Network)

    目录 0. 前言 1. LeNet-5 2. AlexNet 3. VGG-16 4. ResNet 残差网络 5. Inception Network 如果这篇文章对你有一点小小的帮助,请给个关注, ...

  9. 花书+吴恩达深度学习(九)优化方法之二阶近似方法(牛顿法, CG, BFGS, L-BFGS)

    目录 0. 前言 1. 牛顿法 2. 共轭梯度法(CG) 3. BFGS 4. L-BFGS 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔~我会非常开心的~ 花书+吴恩达深度学习(五)正则化 ...

最新文章

  1. SQLer:无需编程语言即可将SQL查询转换为RESTful API的工具
  2. lr_save_string lr_eval_string使用介绍
  3. Eclipse中server启动超时的解决方法
  4. 使用brew cask安装minikube的各种错误和解决方法
  5. [Swift]LeetCode86. 分隔链表 | Partition List
  6. 可以输入也可以下拉选择的select
  7. YbSoftwareFactory 代码生成插件【九】:基于JQuery、WebApi的ASP.NET MVC插件的代码生成项目主要技术解析...
  8. ICCV 2019 | RankSRGAN:排序学习 + GAN 用于超分辨率
  9. 电子围栏判断_电子围栏大用处:进出罐箱指定区域自动通知amp;罐箱库存和使用率自动计算...
  10. 软件测试基础理论知识
  11. JMeter使用教程-压测
  12. Google浏览器下载地址
  13. h5支付不能打开支付宝 ios_iOS 手机网站支付转Native支付(H5支付页面调起支付宝客户端(app))...
  14. 上海率先开放政府数据 医院床位车位信息均可查
  15. Java前方交会后方交会编程_摄影测量后方交会、前方交会程序
  16. workerman创建wss服务
  17. 冒泡排序的交换次数 (树状数组)
  18. 3.21 华丽丽的颜色渐变工具 [原创Ps教程]
  19. 鸣人和佐助 计蒜客--1214 广搜 三维数组
  20. 科学史 科学的旅程 雷.斯潘根贝格 读书笔记要点备忘

热门文章

  1. 使用poi读写Excel
  2. 项目添加GPUImage
  3. g++能过,c++过不了
  4. 2d-x中Lua类型强转问题
  5. Objective-C ,ios,iphone开发基础:UIAlertView使用详解
  6. selenium元素等待及滚动条滚动
  7. AI时代学习新的技术,方向为计算机视觉--欢迎来我的简书blog拔草
  8. 分析 js构造函数:对象方法 、类方法 、原型方法
  9. 反向索引(Inverted Index)
  10. log4j 总结 精华