次导数 次梯度 小结
项目github地址:bitcarmanlee easy-algorithm-interview-and-practice
欢迎大家star,留言,一起学习进步
1.导数(Derivative)的定义
在说次梯度之前,需要先简单介绍一下导数的概念与定义。导数(英语:Derivative)是微积分学中重要的基础概念。一个函数在某一点的导数描述了这个函数在这一点附近的变化率。导数的本质是通过极限的概念对函数进行局部的线性逼近。
对于一般的函数f(x)f(x)f(x),其导数为:
f′(x)=limΔx→0ΔyΔx=limΔx→0f(x0+Δx)−f(x0)Δxf'(x) = \lim_{\Delta x \rightarrow 0} \frac{\Delta y}{\Delta x} = \lim_{\Delta x \rightarrow 0} \frac{f(x_0+\Delta x) - f(x_0)}{\Delta x} f′(x)=Δx→0limΔxΔy=Δx→0limΔxf(x0+Δx)−f(x0)
如果不使用增量,f(x)f(x)f(x)在 x0x_0x0处的导数 也可以定义为:当定义域内的变量 xxx趋近于 x0x_0x0时,
f′(x)=f(x)−f(x0)x−x0f'(x) = \frac{f(x) - f(x_0)}{x - x_0} f′(x)=x−x0f(x)−f(x0)
2.次导数(subderivative)
次导数(subderivative)、次微分(subdifferential)、次切线(subtangent lines)和次梯度(subgradient)的概念出现在凸分析,也就是凸函数的研究中。
设f:I→R是一个实变量凸函数,定义在实数轴上的开区间内。这种函数不一定是处处可导的,例如最经典的例子就是f(x)=∣x∣f(x) = |x|f(x)=∣x∣,在x=0x=0x=0处不可导。但是,从下图的可以看出,对于定义域内的任何x0x_0x0,我们总可以作出一条直线,它通过点(x0,f(x0))(x_0, f(x_0))(x0,f(x0)),并且要么接触f的图像,要么在它的下方。这条直线的斜率称为函数的次导数。
3.次导数与次微分(subdifferential)计算方式
凸函数f:I→R在点x0的次导数,是实数c使得:
f(x)−f(x0)≥c(x−x0)f(x) - f(x_0) \geq c(x - x_0)f(x)−f(x0)≥c(x−x0)
对于所有I内的x。我们可以证明,在点x0的次导数的集合是一个非空闭区间[a, b],其中a和b是单侧极限
a=limx→x0−f(x)−f(x0)x−x0a = \lim_{ x \rightarrow x_0^-} \frac{f(x)-f(x_0)}{x - x_0} a=x→x0−limx−x0f(x)−f(x0)
b=limx→x0+f(x)−f(x0)x−x0b = \lim_{ x \rightarrow x_0^+} \frac{f(x)-f(x_0)}{x - x_0} b=x→x0+limx−x0f(x)−f(x0)
它们一定存在,且满足a ≤ b。
所有次导数的集合[a,b][a, b][a,b]称为函数fff在x0x_0x0的次微分。
例如:考虑凸函数f(x)=∣x∣f(x)=|x|f(x)=∣x∣。在原点的次微分是区间[−1, 1]。x0<0x_0<0x0<0时,次微分是单元素集合{-1},而x0>0x_0>0x0>0,则是单元素集合{1}。
4.性质及推广
1.凸函数f:I→R在x0可导,当且仅当次微分只由一个点组成,这个点就是函数在x0x_0x0的导数。
2.点x0x_0x0是凸函数f的最小值,当且仅当次微分中包含零,也就是说,在上面的图中,我们可以作一条水平的“次切线”。这个性质是“可导函数在极小值的导数是零”的事实的推广。
5.次梯度
次导数和次微分的概念可以推广到多元函数。如果f:U→ R是一个实变量凸函数,定义在欧几里得空间Rn内的凸集,则该空间内的向量v称为函数在点x0的次梯度,如果对于所有U内的x,都有:
f(x)−f(x0)≥v⋅(x−x0)f(x) - f(x_0) \geq v \cdot(x - x_0)f(x)−f(x0)≥v⋅(x−x0)
所有次梯度的集合称为次微分,记为∂f(x0)∂f(x_0)∂f(x0)。次微分总是非空的凸紧集。
次导数 次梯度 小结相关推荐
- 【机器学习】次梯度(subgradient)方法
次梯度方法(subgradient method)是传统的梯度下降方法的拓展,用来处理不可导的凸函数.它的优势是比传统方法处理问题范围大,劣势是算法收敛速度慢.但是,由于它对不可导函数有很好的处理方法 ...
- [机器学习] 深入理解 目标函数,损失函数和代价函数
目标函数,损失函数和代价函数 基本概念: 损失函数:计算的是一个样本的误差 代价函数:是整个训练集上所有样本误差的平均 目标函数:代价函数 + 正则化项 通常机器学习每一个算法中都会有一个目标函数,算 ...
- 微积分在图像处理中的应用
[数字图像处理]七.MFC图像增强之图像普通平滑.高斯平滑.Laplacian.Sobel.Prewitt锐化详解 https://blog.csdn.net/Eastmount/article/de ...
- ML: 导数、方向导数、曲率小结
新手上路,小心晕车 前言 导数.方向导数.梯度这些概念是理解神经网络算法的基础,这里做一个小结. 1.导数 导数(Derivative)是微积分中的重要基础概念,当函数y=f(x)的自变量x在一点x0 ...
- 机器学习中的优化方法小结
来源|福大命大@知乎,https://zhuanlan.zhihu.com/p/158215009 前几天听了林宙辰老师的一个报告,讲的是机器学习中的优化方法[1],做个笔记.推荐机器学习的人去听听. ...
- scikit-learn 逻辑回归类库使用小结
之前在逻辑回归原理小结这篇文章中,对逻辑回归的原理做了小结.这里接着对scikit-learn中逻辑回归类库的我的使用经验做一个总结.重点讲述调参中要注意的事项. 1. 概述 在scikit-lear ...
- 次梯度(subgradient)
次导数 设f在实数域上是一个凸函数,定义在数轴上的开区间内. 这种函数不一定是处处可导的,例如绝对值函数f(x) = |x| . 对于下图来说,对于定义域中的任何x0,我们总可以作出一条直线,它通过点 ...
- Lasso回归算法: 坐标轴下降法与最小角回归法小结
前面的文章对线性回归做了一个小结,文章在这: 线性回归原理小结.里面对线程回归的正则化也做了一个初步的介绍.提到了线程回归的L2正则化-Ridge回归,以及线程回归的L1正则化-Lasso回归.但是对 ...
- 一、基础知识(3)-共轭函数、次梯度
一.共轭函数 1.1 共轭函数的定义和例子 共轭函数:f∗(y)=supx∈domf{yTx−f(x)}f^*(y)=\underset{x\in dom f}{sup}\{y^Tx-f(x)\}f∗ ...
- 第三章 微分中值定理与导数的应用
参考文献 高昆轮 2019考研数学 点进去你会发现新大陆:考研数学证明题的那些事CSDN.知乎 一.微分中值定理 罗尔定理 设 f(x)满足 {[a,b]上连续 (a,b)内可导 f(a)=f(b), ...
最新文章
- 浅析大数据时代下,全球医疗信息技术将出现暴增
- 学习机器学习:这10年我们能在各自的领域做点什么?
- JSP过滤器Filter配置过滤类型汇总
- php rewinddir(),PHP rewinddir() 函数 ——jQuery中文网
- Jquery和雅虎的YQL服务实现天气预报功能!
- oracle 内核参数设置
- JavaSE基础———对象数组和集合Collection
- “丧文化”的祖师:波德莱尔:不懂得使自己的孤独为众人接受的人,也不懂得在碌碌众生中自立。...
- 微信小程序布局理解——flex、block、inline
- 倒闭跑路的P2P网贷平台的特征
- 对字符串按“红黄蓝”进行排序,如“蓝黄红红黄”,输出结果为“红红黄黄蓝”
- 利用DHT网络原理制作bt采集
- 腾讯微信技术总监:十亿用户增长背后的架构秘密
- 判断一个月之前的是星期几
- 会员积分体系付费会员的运营优化方法
- miui8.5 android版本,小米MIUI8.5稳定版
- 数据科学库Python——Pandas使用基础
- 怎样规划你毕业以后的人生 收藏
- Java面向对象程序设计思想(一)
- c语言字符乘号怎么输入,c语言中逗号运算符和乘号哪个优先级高