梯度下降 Gradient Descent 详解、梯度消失和爆炸
1、什么是梯度
在微积分中,对多元函数的参数求∂偏导,把求得的各个参数的偏导数以向量形式写出来即为梯度。
例如对于函数f(x,y),分别对x,y求偏导,求得的梯度向量就是 (∂f/∂x, ∂f/∂y)^T,简称 grad f(x,y),或者▽f(x,y)。相对于的,在点(x_0,y_0)处的梯度就是 (∂f/∂x_0, ∂f/∂y_0)^T, 或者记做 ▽f(x_0,y_0)。
2、梯度的意义
从几何的角度上讲,就是函数变化增加最快的方向。或者说,沿着梯度的方向更容易找到函数的最大值,反过来说沿着梯度相反的方向更容易找到函数的最小值,这就奠定了后面在求解损失函数的最小值时,可以使用梯度下架来求解参数。
3、梯度下降法详解
3.1、梯度下降的直观解释
假设我么在一片山脉上,随机初始化一个坐标,那么沿着梯度的方向就是我们向最陡峭的方向前进一步,这个步长的大小由学习率控制。这样一步步的走下去,一直走到觉得我们已经到了山脚。当然这样走下去,有可能我们不能走到山脚,而是到了某一个局部的山峰低处。
由此来看,使用梯度下降很有可能出现2种情况:
- 跨步太小陷入局部最优无法自发
- 跨步太大错过全局最优
3.2 这中间涉及到几个相关概念:
- 步长(Learning rate):步长决定了在梯度下降迭代的过程中,每一步沿梯度负方向前进的长度。用上面下山的例子,步长就是在当前这一步所在位置沿着最陡峭最易下山的位置走的那一步的长度。
- 特征(feature):指的是样本中输入部分,比如2个单特征的样本(
梯度下降 Gradient Descent 详解、梯度消失和爆炸相关推荐
- 【李宏毅机器学习】04:梯度下降Gradient Descent
李宏毅机器学习04:梯度下降Gradient Descent 文章目录 李宏毅机器学习04:梯度下降Gradient Descent 一.梯度下降方法 二.梯度下降的改进方法 Tip 1: Tunin ...
- Lesson 4.34.4 梯度下降(Gradient Descent)基本原理与手动实现随机梯度下降与小批量梯度下降
Lesson 4.3 梯度下降(Gradient Descent)基本原理与手动实现 在上一小节中,我们已经成功的构建了逻辑回归的损失函数,但由于逻辑回归模型本身的特殊性,我们在构造损失函数时无法采用 ...
- 梯度下降(Gradient Descent),一句代码,一个式子
一直以来,总是觉得国外的PhD们的教育以及课程的安排很好很强大,虽然是说很累作业多工作量大,但是功率大了,效果好点儿,浪费的时间也少,年轻人哪有怕苦怕累的.比比身边好多每天睡超过12小时的研究生们,不 ...
- 机器学习(1)之梯度下降(gradient descent)
机器学习(1)之梯度下降(gradient descent) 题记:最近零碎的时间都在学习Andrew Ng的machine learning,因此就有了这些笔记. 梯度下降是线性回归的一种(Line ...
- 梯度下降 gradient descent
文章目录 导数 偏导数 方向导数 梯度 代价函数的梯度 梯度下降的详细算法 先决条件 算法过程 代价损失中 θ 偏导数公式推导 批量梯度下降(Batch Gradient Descent,BGD) 随 ...
- excel计算二元线性回归_用人话讲明白梯度下降Gradient Descent(以求解多元线性回归参数为例)...
文章目录 1.梯度 2.多元线性回归参数求解 3.梯度下降 4.梯度下降法求解多元线性回归 梯度下降算法在机器学习中出现频率特别高,是非常常用的优化算法. 本文借多元线性回归,用人话解释清楚梯度下降的 ...
- 机器学习中的数学(1)-回归(regression)、梯度下降(gradient descent)
前言: 上次写过一篇关于贝叶斯概率论的数学,最近时间比较紧,coding的任务比较重,不过还是抽空看了一些机器学习的书和视频,其中很推荐两个:一个是stanford的machine learning公 ...
- 机器学习代码实战——梯度下降(gradient descent)
文章目录 1.实验目的 2.梯度下降 2.1.借助sklearn库 2.2.手写梯度下降函数 1.实验目的 本实验将使用两种方法实现梯度下降算法并可打印出参数,可视化梯度下降过程.第一种方法是借助sk ...
- 随机梯度下降与动量详解
1. SGD图示 红色表示SGD的收敛路径,棕色表示梯度下降的收敛路径.普通的GD算法就是计算出每一时刻最陡的下降趋势(梯度),SGD在随机挑选某一分量的梯度方向进行收敛,详细解释可继续往下看. 2. ...
最新文章
- 解析gui-config.json出差_LUA解析json小demo
- 永远不要让女生帮你寄领带
- 数据结构和算法 —— 谈谈算法
- 1019 数字黑洞 (20 分)(c语言)
- idea 版本控制忽略文件、文件夹设置
- 基于 DirectShow 的播放器
- java json返回null_java-JSON jsonObject.optString()返回字符串“ null”
- python y轴倒转_python – Config Kivy y轴的反转输入
- #{}不自动改参数类型_Spring参数的自解析还在自己转换?你out了!
- 【Tensorflow】Windows下基于Anaconda的Tensorflow环境配置
- 【购买ipad 2021记录:Apple官网线上下单,直营店线下取货】
- POI 实现Word替换书签
- 2022年下半年深圳地区数据分析师认证(CPDA),[进入查看]
- 禁用的灰色文本框、按钮的克星
- pandas-综合练习
- 小米路由器3开启千兆_使用评测 篇三:家庭网络进入千兆时代—小米路由器4开箱及评测...
- 如何绘制业务架构图 — 2.框架图
- 坐着童年纸飞机的C语言for循环!超好玩!超详细!
- C语言函数针对训练--递归篇(动画讲解,由易到难递归例题)
- Wifi文件传输项目总结
热门文章
- 【李宏毅机器学习】04:梯度下降Gradient Descent