1 学习率的大小

2 Adagrad

2.1 Adagrad结论

2.2 Adagrad推导

g不变

η随着t的增加而减少

σ是之前梯度的均方根

3 Adagrad的优缺点

3.1 优点

可以动态调整学习率,因而相比于SGD来说,可以更少地进行手动对学习率的调参

3.2 缺点

  • 如果我们把 视为学习率的话,那么学习率会很快降到一个很小的值,之后会很慢收敛了。
  • η的值需要认为指定,如果设置的太大的话,就会发生震荡;太小的话全局学习率又会较低

机器学习笔记:Adagrad相关推荐

  1. 李弘毅机器学习笔记:第十二章—Recipe of Deep Learning

    李弘毅机器学习笔记:第十二章-Recipe of Deep Learning 神经网络的表现 如何改进神经网络? 新的激活函数 梯度消失 怎么样去解决梯度消失? Adaptive Learning R ...

  2. 李弘毅机器学习笔记:第十章:Keras2.0

    李弘毅机器学习笔记:第十章:Keras2.0 创建网络 配置 选择最好的方程 使用模型 创建网络 假设我们要做的事情是手写数字辨识,那我们要建一个Network scratch,input是28∗28 ...

  3. 李弘毅机器学习笔记:第十一章—Keras Demo

    李弘毅机器学习笔记:第十一章-Keras Demo 创建网络 配置 选择最好的方程 使用模型 创建网络 假设我们要做的事情是手写数字辨识,那我们要建一个Network scratch,input是28 ...

  4. 一份520页的机器学习笔记!附下载链接

    点击上方"视学算法",选择"星标"公众号 第一时间获取价值内容 近日,来自SAP(全球第一大商业软件公司)的梁劲(Jim Liang)公开了自己所写的一份 52 ...

  5. 700 页的机器学习笔记火了!完整版开放下载

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 作者       梁劲(Jim Liang),来自SAP(全球第一大商业软件公司). 书籍特点       条理清晰 ...

  6. 机器学习笔记十四:随机森林

    在上一篇机器学习笔记十三:Ensemble思想(上)中,简要的提了一下集成学习的原理和两种主要的集成学习形式.  而在这部分要讲的随机森林,就算是其中属于bagging思路的一种学习方法.为了篇幅,b ...

  7. 机器学习笔记七:损失函数与风险函数

    一.损失函数 回顾之前讲过的线性回归模型,我们为了要学习参数使得得到的直线更好的拟合数据,我们使用了一个函数 这个函数就是比较模型得到的结果和"真实值"之间的"差距&qu ...

  8. 吴恩达机器学习笔记55-异常检测算法的特征选择(Choosing What Features to Use of Anomaly Detection)

    吴恩达机器学习笔记55-异常检测算法的特征选择(Choosing What Features to Use of Anomaly Detection) 对于异常检测算法,使用特征是至关重要的,下面谈谈 ...

  9. Python机器学习笔记:sklearn库的学习

    自2007年发布以来,scikit-learn已经成为Python重要的机器学习库了,scikit-learn简称sklearn,支持包括分类,回归,降维和聚类四大机器学习算法.还包括了特征提取,数据 ...

  10. 神经网络与机器学习 笔记—LMS(最小均方算法)和学习率退火

    神经网络与机器学习 笔记-LMS(最小均方算法)和学习率退火 LMS算法和Rosenblatt感知器算法非常想,唯独就是去掉了神经元的压制函数,Rosenblatt用的Sgn压制函数,LMS不需要压制 ...

最新文章

  1. 如何使用万用表测量随机噪声
  2. Dell服务器的 Idrac调试口的配置方式
  3. 数据库 1205 Error 'Lock wait timeout exceeded; try restarting transaction' on query
  4. 每天一个linux命令(25):linux文件属性详解
  5. 《关键对话》读书笔记作文3700字
  6. 真正简单的基于prototype的表单验证
  7. html调用静态json例子
  8. python中__del__使用方法
  9. C++/Qt 序列化操作
  10. 2020 年,最适合 AI 的 5 种编程语言
  11. 1.79亿实景三维项目!与房地一体有何区别?
  12. OpenCV-获取图像中直线上的数据
  13. Paxos—以选美比赛为例PPT
  14. 【转】Java 杂谈(三)
  15. 解决办法:eclipse查看安卓8.0及以上设备的LOG
  16. 陈欧:创业是最美好的生活方式
  17. python打开autocad
  18. 中国中型皮卡市场趋势报告、技术动态创新及市场预测
  19. 【数据分析】数据分析需要掌握的统计学理论基础知识
  20. 查询服务器主机CPU是几核?附应用场景展示(已解决)

热门文章

  1. 一些软件软件开发原则
  2. Hive 和普通关系数据库的异同
  3. FreeMarker 一二事 - 静态模板的使用与生成
  4. java 线程的几种状态(转载)
  5. 读取SBT项目resources目录中的文件
  6. 用匈牙利算法求二分图的最大匹配
  7. Json-lib使用——JSONObject与JSONArray
  8. 【试验】三个用于日常监控开发库与对应测试库的存储过程
  9. 抢救站位图片_抢救配合流程和站位,你真的规范了吗
  10. java统计日志qps_【原创】基于日志增量,统计qps,并基于ip排序