利普希茨连续(Lipschitz continuous)

利普希茨连续的定义是:如果函数fff在区间QQQ上以常数LLL利普希茨连续,那么对于x,y∈Qx, y \in Qx,y∈Q,有:∣∣f(x)−f(y)∣∣≤L∣∣x−y∣∣||f(x) - f(y)|| \leq L||x - y||∣∣f(x)−f(y)∣∣≤L∣∣x−y∣∣ 其中常数LLL称为fff在区间QQQ上的Lipschitz常数

除了Lipschitz continuous之外,Lipschitz continuous gradient 和 Lipschitz continuous Hessian也是常用到的概念,它们都是由Lipschitz continuous概念延伸出来的。值得一提的是,很多论文中,尤其是关于凸优化的问题,Lipschitz continuous gradient的应用更为常见。

其中,如果函数fff满足Lipschitz continuous gradient,就意味着它的导数f′f'f′满足Lipschitz continuous,即如果函数fff满足Lipschitz continuous gradient,则:∣∣f′(x)−f′(y)∣∣≤L∣∣x−y∣∣||f'(x) - f'(y)|| \leq L||x - y||∣∣f′(x)−f′(y)∣∣≤L∣∣x−y∣∣

其中,如果函数fff满足Lipschitz continuous Hessian,就意味着它的二阶导数f′′f''f′′满足Lipschitz continuous,即如果函数fff满足Lipschitz continuous Hessian,则:∣∣f′′(x)−f′′(y)∣∣≤L∣∣x−y∣∣||f''(x) - f''(y)|| \leq L||x - y||∣∣f′′(x)−f′′(y)∣∣≤L∣∣x−y∣∣

从上面的定义中可以看出,利普希茨连续限制了函数fff的局部变动幅度不能超过某常量。同样的道理,Lipschitz continuous gradient和Lipschitz continuous Hessian则限制了函数的导函数和二阶导函数的局部变化幅度。

相关定理(Theorems)

1、如果函数fff符合Lipschitz continuous,根据上面的公式可以得到下面的不等式:
{f(y)≤f(x)+L∣∣y−x∣∣f(y)≥f(x)−L∣∣y−x∣∣\left\{ \begin{aligned} f(y)&\leq f(x) + L||y - x||\\ f(y)&\geq f(x)- L||y - x|| \end{aligned} \right.{f(y)f(y)​≤f(x)+L∣∣y−x∣∣≥f(x)−L∣∣y−x∣∣​固定变量xxx,不等式的右端即是一个一次的函数,即函数fff被一次函数上下逼近。

2、如果函数fff在RnR^{n}Rn上满足Lipschitz continuous gradient,则对于任意x,y∈Rnx, y \in R^{n}x,y∈Rn有:∣f(y)−f(x)−<f′(x),y−x>∣≤L/2∣∣y−x∣∣2|f(y) - f(x) - <f'(x), y - x>| \leq L/2 ||y - x||^{2}∣f(y)−f(x)−<f′(x),y−x>∣≤L/2∣∣y−x∣∣2根据上面的公式,去掉绝对值,可以得到下面的不等式:
{f(y)≤f(x)+<f′(x),y−x>+L/2∣∣y−x∣∣2f(y)≥f(x)+<f′(x),y−x>−L/2∣∣y−x∣∣2\left\{ \begin{aligned} f(y)&\leq f(x) + <f'(x), y-x> + L/2||y - x||^{2}\\ f(y)&\geq f(x) + <f'(x), y-x> - L/2||y - x||^{2} \end{aligned} \right.{f(y)f(y)​≤f(x)+<f′(x),y−x>+L/2∣∣y−x∣∣2≥f(x)+<f′(x),y−x>−L/2∣∣y−x∣∣2​固定变量xxx,不等式的右端即是一个二次的函数,即函数fff被二次函数上下逼近。或者也可以理解为函数f′f'f′被一次函数上下逼近。
3、如果函数fff在RnR^{n}Rn上满足Lipschitz continuous Hessian,则对于任意x,y∈Rnx, y \in R^{n}x,y∈Rn有:∣f(y)−f(x)−<f′(x),y−x>−12<f′′(x)(y−x),y−x>∣≤L/6∣∣y−x∣∣3|f(y) - f(x) - <f'(x), y - x> - \frac{1}{2}<f''(x)(y - x), y-x>| \leq L/6 ||y - x||^{3}∣f(y)−f(x)−<f′(x),y−x>−21​<f′′(x)(y−x),y−x>∣≤L/6∣∣y−x∣∣3根据上面的公式,去掉绝对值,可以得到下面的不等式:
{f(y)≤f(x)+<f′(x),y−x>+12<f′′(x)(y−x),y−x>+L/6∣∣y−x∣∣3f(y)≥f(x)+<f′(x),y−x>+12<f′′(x)(y−x),y−x>−L/6∣∣y−x∣∣3\left\{ \begin{aligned} f(y)&\leq f(x) + <f'(x), y-x> + \frac{1}{2}<f''(x)(y - x), y-x> + L/6 ||y - x||^{3}\\ f(y)&\geq f(x) + <f'(x), y-x> + \frac{1}{2}<f''(x)(y - x), y-x> - L/6 ||y - x||^{3} \end{aligned} \right.⎩⎪⎨⎪⎧​f(y)f(y)​≤f(x)+<f′(x),y−x>+21​<f′′(x)(y−x),y−x>+L/6∣∣y−x∣∣3≥f(x)+<f′(x),y−x>+21​<f′′(x)(y−x),y−x>−L/6∣∣y−x∣∣3​固定变量xxx,不等式的右端即是一个三次的函数,即函数fff被三次函数上下逼近。或者也可以理解为函数f′′f''f′′被一次函数上下逼近。

关于上面的证明可以参考非凸优化基石:Lipschitz Condition

参考资料

利普希茨连续的几何意义是什么?怎么较好的理解它呢? - 知乎
非凸优化基石:Lipschitz Condition

【优化】利普希茨连续(Lipschitz continuous)及其应用相关推荐

  1. 利普希茨连续(Lipschitz continuous)及其应用

    参考链接: https://www.zhihu.com/question/51809602 https://zhuanlan.zhihu.com/p/27554191 https://blog.csd ...

  2. 【人工智能的数学基础】利普希茨连续条件(Lipschitz Continuity Condition)

    文章目录 1. 利普希茨连续条件的定义 2. 神经网络中的利普希茨约束 3. 实现Lipschitz约束的方法 (1)权重裁剪 weight clipping (2)梯度惩罚 gradient pen ...

  3. Lipschitz continuous gradient

    这是新博客的第二篇,Lipschitz continuous gradient .主要内容是关于各种条件之间的关系以及证明,希望对大家有所帮助.

  4. [LA] Lipschitz continuous gradient

    Definitions Summary 1. Definitions ∇f(x)\nabla f(x) is L- Lipschitz continuous, then we have (1) ∥∇f ...

  5. mysql 字段加减_MySQL数据库开发常见问题及优化(续)

    在设计表或索引时,常出现以下几个问题: 1.少建索引或不建索引.这个问题最突出,建议建表时 DBA 可以一起协助把关. 2.索引滥用.滥用索引将导致写请求变慢,拖慢整体数据库的响应速度(5.5 以下的 ...

  6. (数字IC)低功耗设计入门(七)——门级电路低功耗设计优化(续)

    前面讲解了门级功耗的优化方法,包括静动态和总体的功耗.现在来记录一下门级层次(有点书也说是在系统级)常用的一种低功耗方法--电源门控. ①电源门控概述与原理 电源门控是指芯片中某个区域的供电电源被关掉 ...

  7. 凸优化学习笔记 15:梯度方法

    前面的章节基本上讲完了凸优化相关的理论部分,在对偶原理以及 KKT 条件那里我们已经体会到了理论之美!接下来我们就要进入求解算法的部分,这也是需要浓墨重彩的一部分,毕竟我们学习凸优化就是为了解决实际当 ...

  8. 基于优化反馈的组合在线学习

    点击上方蓝字关注我们 基于优化反馈的组合在线学习 孔芳1, 杨悦然1, 陈卫2, 李帅1 1 上海交通大学约翰·霍普克罗夫特计算机科学中心,上海 200240 2 微软亚洲研究院,北京 100080 ...

  9. 如何将一个向量投影到一个平面上_如何在黎曼流形上避开鞍点?本文带你了解优化背后的数学知识...

    机器之心原创 作者:Joshua Chou 编辑:Joni Zhong翻译:魔王 在一篇名为<Escaping from saddle points on Riemannian manifold ...

最新文章

  1. 软件体系结构风格(第5-8课时)
  2. go使用反射reflect获取变量类型
  3. 样式篇之如何实现合并单元格效果 【转】
  4. 『教程』Batch Normalization 层介绍
  5. Cool!15个创意的 CSS3 文本效果【下篇】
  6. 飞船赛——FOJ 1021
  7. 回溯法解整数的划分问题(C语言)
  8. 最优化课堂笔记02:第二章 线性规划
  9. Node.js 可以和 Web 实现 HTTP 请求的跨平台兼容了!
  10. Eclipse JAVA项目的 目录结构 和 导入 import菜单使用
  11. 【华为敏捷/DevOps实践】3. 如何开好站立会议
  12. MATLAB牛拉法计算潮流,Matlab牛拉法潮流计算程序
  13. PM、PO、PO、PMO、PMP的区别和介绍
  14. python 100以内的奇数和_python入门:输出1-100之内的所有奇数和偶数
  15. Dva员工增删改查Demo实现-优化
  16. 用HTML5的canvas实现抽奖刮刮卡的效果(只需十几行代码)
  17. Q/GDW376.1主站与采集终端通信协议测试方法
  18. 电话那头原来是个大美女
  19. Tensorflow的基本概念与常用函数
  20. CSS学习笔记7—盒子模型

热门文章

  1. 1、Debian-Pi-Aarch64 系统安装
  2. MOSFET, MOS管, 开关管笔记
  3. 什么是GB18030编码?
  4. LVM 的自定义报告(pvs vgs lvs各参数详解)
  5. 深入理解tensorflow架构设计与实现原理(彭靖田著)
  6. IDEA怎么查看现在的项目使用的JDK版本? 2016年4月19日22:51
  7. DMB DSB和ISB区别
  8. 启动TC的TAO窗口
  9. Dojo1.11官方教程文档翻译(3.5)动画
  10. 利用Python里的cv2(opencv)改变图片大小【同时也是cv2.resize的学习】