Strong-Convexity:强凸性
Strong-Convexity:强凸性
- 性质
- 其余情况
强凸性多用在优化中(Optimization),特别是保证很多基于梯度下降方法的算法的线形收敛速率的条件之一。
一个可微函数强凸的定义是:
f(y)≥f(x)+∇f(x)T(y−x)+u2∥y−x∥2f(y) \ge f(x) +\nabla f(x)^T(y-x)+\frac{u}{2} \Vert y-x \Vert ^2 f(y)≥f(x)+∇f(x)T(y−x)+2u∥y−x∥2
值得注意的是,强凸性并不要求函数处处可微(differentiable),当函数不光滑的时候,梯度即用次梯度(sub-gradient)代替。从表达式来看,强凸比一般的凸函数更严格在于其中的的二次项u2∥y−x∥2\frac{u}{2}\Vert y-x \Vert ^22u∥y−x∥2.因此可以将其表述为u-strong convex。
这个强凸的性质是很重要的。直观从一维函数来说,一般凸函数只要求函数曲线在其切线之上,至于“上”多少没有要求,也就意味着曲线可以无限“贴着”切线,只要保持在其上就行了。毫无疑问,在优化特别是梯度优化中,这种微弱的梯度变化很难实现快速优化,有可能在有限次数还达不到收敛。如果我们取一个接近最小值的解,这也很难。“非常”接近只是一个定性理解,在这种情况下会出现最优解很近似但是决策变量相差巨大的糟糕情况。这时候,多加一个二次项的,保证有一个二次下界,那么不会出现“贴着”切线的情况,优化也变得更加简单。
有的情况下,没有强凸的条件,可以人为加上一个二次项,以获得强凸特性。
性质
除了定义的性质外,强凸函数还有以下的性质。
- (∇f(x)−∇f(y))T(x−y)≥u∥x−y∥2(\nabla f(x)-\nabla f(y))^T(x-y)\ge u \Vert x-y \Vert^2(∇f(x)−∇f(y))T(x−y)≥u∥x−y∥2
- f(ax+(1−a)y)≤af(x)+(1−a)f(y)−α(1−α)u2∥x−y∥2,α∈[0,1]f(ax+(1-a)y)\le af(x)+(1-a)f(y)-\frac{\alpha(1-\alpha)u}{2}\Vert x-y\Vert^2,\alpha\in [0,1]f(ax+(1−a)y)≤af(x)+(1−a)f(y)−2α(1−α)u∥x−y∥2,α∈[0,1]
其余情况
某些情况也会表示函数是强凸性质的,其中第一条被称为 Polyak-Lojasiewicz(PL)不等式。
- 12∥∇f(x)∥2≥u(f(x)−f∗)\frac{1}{2}\Vert \nabla f(x)\Vert^2\ge u(f(x)-f^*)21∥∇f(x)∥2≥u(f(x)−f∗)
- ∥∇f(x)−∇f(y)∥≥u∥x−y∥\Vert \nabla f(x)- \nabla f(y)\Vert \ge u \Vert x-y \Vert∥∇f(x)−∇f(y)∥≥u∥x−y∥
- f(y)≤f(x)+∇f(x)T(y−x)+12u∥∇f(y)−∇f(x)∥2f(y)\le f(x)+\nabla f(x)^T(y-x)+\frac{1}{2u}\Vert \nabla f(y)-\nabla f(x)\Vert^2f(y)≤f(x)+∇f(x)T(y−x)+2u1∥∇f(y)−∇f(x)∥2
- (∇f(x)−∇f(y))T(x−y)≤1u∥∇f(x)−∇f(y)∥2(\nabla f(x)-\nabla f(y))^T(x-y)\le \frac{1}{u}\Vert \nabla f(x)-\nabla f(y)\Vert^2(∇f(x)−∇f(y))T(x−y)≤u1∥∇f(x)−∇f(y)∥2
Strong-Convexity:强凸性相关推荐
- 强凸性带来的 距离最优值的上下界
与平滑性类似,强凸也会带来一个类似的上下界.我们先上结论: 如果函数是,那么存在这么一个上下界 这个界与平滑那个上下界简直不要太像,只是换了一下位置.接下来我们证明. 已知函数强凸,有 我们令,其中是 ...
- C语言强数Strong number算法(附完整源码)
强数Strong number算法 何为Strong number强数 C语言强数Strong number算法完整源码(定义,实现,main函数测试) 何为Strong number强数 强数是一个 ...
- copy, retain, assign , readonly , readwrite,strong,weak,nonatomic整理
copy:建立一个索引计数为1的对象,然后释放旧对象 对NSString 对NSString 它指出,在赋值时使用传入值的一份拷贝.拷贝工作由copy方法执行,此属性只对那些实行了NSCopying协 ...
- iOS开发中@property的属性weak nonatomic strong readonly等介绍
@property与@synthesize是成对出现的,可以自动生成某个类成员变量的存取方法.在Xcode4.5以及以后的版本,@synthesize可以省略. 1.atomic与nonatomic ...
- strong vs copy
一.前言 在这里,我通过实例去介绍strong和copy的区别(%p打印出来对象的地址) ViewController.h #import <UIKit/UIKit.h&g ...
- @property 各个属性作用【使用时最需注意strong/weak类型】【补充部分内存知识】...
一. 属性readwrite,readonly,assign,retain,copy,nonatomic 等各是什么作用,在那种情况下用? 1> readwrite:同时生成get方法和set ...
- Java中的引用:强软弱虚
前言 之前在研究MVP的时候接触过弱引用,用来避免由于Activity被回收导致的内存泄露,但是当时只是浅尝辄止,没有系统的去接触引用这一块,没想到最近在看ThreadLocal的时候又看到关于引用的 ...
- 李洪强经典面试题18
多线程.特别是NSOperation 和 GCD 的内部原理. 运行时机制的原理和运用场景. SDWebImage的原理.实现机制.如何解决TableView卡的问题. block和代理的,通知的区别 ...
- 【文献阅读】Federated Accelerated Stochastic Gradient Descent
文章目录 1 Federated Accelerated Stochastic Gradient Descent (FedAc) 2 challenge 3 how to do 4 baseline ...
- 机器人中的数值优化|【一】数值优化基础
数值优化基础 凸集 Convex Sets 凸集的定义 令X是线性空间.如果对于X的子集S中的所有x和y,并且在区间 [0,1]中的所有t,点 ( 1 − t ) x + t y (1-t)x + t ...
最新文章
- 01-Vue博客后台管理页面框架搭建
- Apache通过配置.htaccess文件禁止访问.git、.svn等目录
- 漫步者蓝牙驱动_有什么平价好用的蓝牙耳机?双11不踩雷高性价比蓝牙耳机推荐...
- configurationproperties_【Springboot】注解@ConfigurationProperties让配置整齐而简单
- while 循环java_Java做while循环
- Java基础IO流(二)字节流小案例
- qt html 案例,QT代替WebView的方法及使用例子
- 【MATLAB】(一)基本使用入门
- 介绍几个能下载中英文双语字幕电影的网站
- 项目验收文档模板(一)
- 常见的技术文档英文单词
- 国外的一个网站不能够访问
- javaFX 学习之 超链接(HyperLink) 转载
- QT 利用QAxObject大数据读写excel文件
- Mysql必知必会概要总结
- 微信开始屏蔽拼多多小红书快手外链访问
- 亳州的来历(地名的由来)
- anemometer mysql 500_【Mysql】Anemometer-可视化慢sql查看
- 微信对话生成器,生成微信聊天记录,聊天记录生成器,制作微信聊天记录,可生成文字、语音、转账、红包,朋友圈装X神器~
- Mybatis order by 动态传参出现的一个小bug
热门文章
- Qt读写Excel--QXlsx合并单元格、文本对齐7
- 机器学习基础--math(20)--流形/黎曼流形
- 2003年第三批全国名老中医
- 以太坊ETH(windows)配置
- 全国卖菜大爷将大面积失业,社区团购夺走卖菜商贩生计,真的会出问题吗
- vmware 桌面 服务器版,vmware云桌面软件服务器(vmware云桌面搭建教程)
- LSL学习笔记(4)
- 计算机病毒结构及技术分析
- 门面担当——外观模式
- 广西事业单位考试 计算机基础知识,2018年广西壮族自治区事业单位考试《公共基础知识》1000题【必考题库】.pdf...