目录

  • Moreau-Yosida regularization
  • 与次梯度的联系 \(\mathbf{prox}_{\lambda f} = (I + \lambda \partial f)^{-1}\)
  • 改进的梯度路径
  • 信赖域问题

Proximal Algorithms

这一节,作者总结了一些关于proximal的一些直观解释

Moreau-Yosida regularization

内部卷积(infimal convolution):
\[ (f \: \Box \: g)(v)=\inf_x (f(x)+g(v-x)) \]

Moreau-Yosida envelope 或者 Moreau-Yosida regularization 为:
\[ M_{\lambda f}=\lambda f \: \Box \: (1/2)\|\cdot\|_2^2 \], 于是:

事实上,这就是,我们在上一节提到过的东西。就像在上一节一样,可以证明:
\[ M_f (x) = f(\mathbf{prox}(x)) + (1/2) \|x-\mathbf{prox}_f(x)\|_2^2 \]
以及:
\[ \nabla M_{\lambda_f}(x) = (1 / \lambda)(x- \mathbf{prox}_{\lambda f}(x)) \]
虽然上面的我不知道在\(f\)不可微的条件下怎么证明.
于是有与上一节同样的结果:

总结一下就是,近端算子,实际上就是最小化\(M_{\lambda f}\), 等价于\(\nabla M_{f^*}\),即:
\[ \mathbf{prox}_f(x) = \nabla M_{f^*} (x) \]
这个,需要通过Moreau分解得到.

与次梯度的联系 \(\mathbf{prox}_{\lambda f} = (I + \lambda \partial f)^{-1}\)


上面的式子,有一个问题是,这个映射是单值函数吗(论文里也讲,用关系来讲更合适),因为\(\partial f\)的原因,不过,论文的意思好像是的,不过这并不影响证明:

改进的梯度路径

就像在第一节说的,和之前有关Moreau envelope表示里讲的:
\[ \mathbf{prox}_{\lambda f} (x) = x - \lambda \nabla M_{\lambda f}(x) \]
实际上,\(\mathbf{prox}_{\lambda f}\)可以视为最小化Moreau envelope的一个迭代路径,其步长为\(\lambda\). 还有一些相似的解释.
假设\(f\)是二阶可微的,且\(\nabla^2 f(x) \succ0\)(表正定),当\(\lambda \rightarrow 0\):
\[ \mathbf{prox}_{\lambda f} (x) = (I + \lambda \nabla f)^{-1} (x) = x - \lambda \nabla f(x)+o(\lambda) \]
这个的证明,我觉得是用到了变分学的知识:
\[ \delta(I+\lambda \nabla f)^{-1}|_{\lambda=0}=-\frac{\nabla f}{(I+\lambda \nabla f)^{-2}}|_{\lambda =0}= -\nabla f \]
所以上面的是一阶距离的刻画.

我们先来看\(f\)的一阶泰勒近似:


其近端算子为:

感觉,实际上是为:\(\mathbf{prox}_{\lambda \hat{f}_v^{(1)}}\)

相应的,还有二阶近似:

这个是Levenberg-Marquardt update的牛顿方法,虽然我不知道这玩意儿是什么.

上面的证明都是容易的,直接更具定义便能导出.

信赖域问题

proximal还可以用信赖域问题来解释:


而普通的proximal问题:

约束条件变成了惩罚项, 论文还指出,通过指定不同的参数\(\rho\)和\(\lambda\),俩个问题能互相达到对方的解.

转载于:https://www.cnblogs.com/MTandHJ/p/10992036.html

Proximal Algorithms 3 Interpretation相关推荐

  1. Proximal Algorithms 4 Algorithms

    目录 Proximal minimization 解释 \(f(x) + g(x)\) 解释1 最大最小算法 不动点解释 Forward-backward 迭代解释 加速 proximal gradi ...

  2. 近端算法:近端最小化(Proximal minimization)、近端梯度(PG)、加速近端梯度(APG)、ADMM

    近端算法 基本介绍及定义 定义 工作原理 性质 近端算子解释 Moreau-Yosida正则化 次微分算子的预解 修正梯度步长 信任区域问题 近端算法(Proximal Algorithms) 近端最 ...

  3. ICML 2018 paper(oral)

    参考链接 icml 2018 oral Paperlist Optimal Tuning for Divide-and-conquer Kernel Ridge Regression with Mas ...

  4. 比可微架构搜索DARTS快10倍,第四范式提出优化NAS算法

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 神经架构搜索一直被认为是高算力的代表,尽管可微架构搜索的概念非常吸引人,但它目前的 ...

  5. l2高斯分布_L1和L2正则的区别,如何选择L1和L2正则?L1在0处不可导,怎么处理...

    首先毫无疑问的,他们都是可以防止过拟合,降低模型复杂度 L1是在loss function后面加上模型参数的1范数(也就是|xi|)L0范数的最小化问题在实际应用中是NP难问题,无法实际应用.L2是在 ...

  6. ADMM算法相关资源

    转载自:https://web.stanford.edu/~boyd/admm.html,版权归原作者所有. ADMM The alternating direction method of mult ...

  7. 强化学习——Proximal Policy Optimization Algorithms

    文章目录 前言 为什么需要PPO TRPO PPO 前言 本文对论文<Proximal Policy Optimization Algorithms>进行总结,如有错误,欢迎指出. 为什么 ...

  8. 【文献阅读】Proximal Policy Optimization Algorithms

    Author: John Schulman 原文摘要 我们提出了一种新的强化学习的 策略梯度方法,该方法在 与环境互动中进行采样 和 使用随机梯度提升算法优化"surrogate" ...

  9. Proximal Policy Optimization Algorithms翻译

    摘要 我们提出了一类新的用于强化学习的策略梯度方法,该方法可以在与环境交互进行数据采样和使用随机梯度上升优化一个"替代"目标函数之间进行交替.标准策略梯度方法对每个数据样本执行一个 ...

最新文章

  1. redis 管理工具_Redis的跨平台GUI 桌面管理工具
  2. 程序员节,10月24日!
  3. linux导出文件夹到u盘,Linux系统放到U盘上直接在U盘上运行Linux
  4. Android悬浮按钮锚点位置,Android 滑动定位+吸附悬停效果实现
  5. android 调用c wcf服务,如何使用命名管道从c调用WCF方法?
  6. dubbo protocol port 消费者端_Dubbo源码:搞定URL,就走完了进度条的一半
  7. tensorFlow13卷积神经网络发展
  8. 过http user-agent判断是否为手机浏览器
  9. HBase的RowKey设计
  10. 洛谷 [P1890] gcd区间
  11. One账户多设备同步的数据库设计
  12. mysql实现axure协同工作_AxureUX CRM及协同办公APP高保真原型模板(带移动端实用元件库)...
  13. 计算机水平2018下半年模拟考试,2018年下半年程序员考试下午试题及答案
  14. Java实现对文件的读与写
  15. 中望cad自定义快捷键命令_设置快捷键提高中望CAD绘图速度
  16. 【网络通讯开发系列】如何使用C语言编程通过UDP通讯解析域名
  17. Kali Linux中安装IDLE的方法
  18. 哪吒票房逼近30亿,从豆瓣短评简单分析人们对哪吒的态度
  19. OCR手机证件扫描光学字符识别
  20. 2018世界人工智能大会开幕 森亿智能张少典谈AI与医疗融合

热门文章

  1. strut2以及路径的一些问题
  2. 分享一个 org.w3c.dom XML 封装
  3. 提升tomcat 性能的经验
  4. HDU - 6438(贪心+思维)
  5. 媒体查询 响应式设计
  6. Alpha 冲刺 (5/10)
  7. tomcat升级后报错: Invalid character found in the request target.
  8. 客户端 localStorage, sessionStorage, cookie 的区别
  9. TeamTalk源码分析之login_server
  10. 多线程的使用——模拟线程池的实现(2015-12-02 00:14:59)