Navigator

  • Derivation of the ADMM algorithm
  • Stopping criterion: Primal-Dual Gap
  • Reference

Derivation of the ADMM algorithm

To facilitate the application of proximal operators involving ρλ\rho_\lambdaρλ​, we first construct the following equation:
min⁡w∈Rk,v∈Rkϕ2w′Σw−μ′w+ρλ(v)s.t.{w=v∑i=1kwi=1\begin{aligned} &\min_{w\in\mathbb{R}^k, v\in\mathbb{R}^k} \frac{\phi}{2}w'\Sigma w-\mu'w+\rho_\lambda(v)\\ &s.t. \begin{cases} w=v\\ \sum_{i=1}^kw_i=1 \end{cases} \end{aligned} ​w∈Rk,v∈Rkmin​2ϕ​w′Σw−μ′w+ρλ​(v)s.t.{w=v∑i=1k​wi​=1​​
where ρλ(w)=∑i=1kλi∣w∣(i)\rho_\lambda(w)=\sum_{i=1}^k\lambda_i|w|_{(i)}ρλ​(w)=∑i=1k​λi​∣w∣(i)​ is the sorted lll_1-Norm corresponding to the sequence λSLOPE=(λ1,λ2,…,λk)′\lambda_{SLOPE}=(\lambda_1, \lambda_2, \dots, \lambda_k)'λSLOPE​=(λ1​,λ2​,…,λk​)′ satisfying λ1≥λ2…λk≥0\lambda_1\geq \lambda_2\dots\lambda_k\geq 0λ1​≥λ2​…λk​≥0. An ADMM algorithm is designed to solve the augumented Lagrangian function and on partial updates for the primal variables. The associated augmented Lagrangian is given as:
Lη=ϕ2w′Σw−μ′w+ρλ(v)+α′(w−v)+β′(e′w−1)+η2{∣∣w−v∣∣2+(e′w−1)2}L_\eta=\frac{\phi}{2}w'\Sigma w-\mu'w+\rho_\lambda(v)+\alpha'(w-v)+\beta'(e'w-1)+\frac{\eta}{2}\{||w-v||^2+(e'w-1)^2\} Lη​=2ϕ​w′Σw−μ′w+ρλ​(v)+α′(w−v)+β′(e′w−1)+2η​{∣∣w−v∣∣2+(e′w−1)2}
Compared to the Lagrangian L0L_0L0​ without the penalty term, the augumented Lagrangian LηL_\etaLη​ with η>0\eta>0η>0 brings the benefit that the dual objective gη(α,β):=inf⁡w,vLη(w,v,α,β)g_\eta(\alpha, \beta):=\inf_{w, v}L_\eta(w,v,\alpha,\beta)gη​(α,β):=infw,v​Lη​(w,v,α,β) becomes differentiable without requiring further assumption on the primal objective. The ADMM algorithm consists of the updates:
{wj+1=arg min⁡wLη(w,vj,αj,βj)vj+1=arg min⁡vLη(wj+1,v,αj,βj)αj+1=αj+η(wj+1−vj+1)βj+1=βj+η(e′wj+1−1)\begin{cases} w^{j+1}=\argmin_{w}L_\eta(w, v^j, \alpha^j, \beta^j)\\ v^{j+1}=\argmin_{v} L_\eta(w^{j+1}, v, \alpha^j, \beta^j)\\ \alpha^{j+1}=\alpha^j+\eta(w^{j+1}-v^{j+1})\\ \beta^{j+1}=\beta^j+\eta(e'w^{j+1}-1) \end{cases} ⎩⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎧​wj+1=wargmin​Lη​(w,vj,αj,βj)vj+1=vargmin​Lη​(wj+1,v,αj,βj)αj+1=αj+η(wj+1−vj+1)βj+1=βj+η(e′wj+1−1)​
The first iterates w0,v0,α0,β0w^0, v^0, \alpha^0, \beta^0w0,v0,α0,β0 are typically intialized as the zero vectors.

Stopping criterion: Primal-Dual Gap

The stopping criterion for the ADMM algorithm is based on the Primal-Dual Gap. First, taking the infimum over (w,v)(w, v)(w,v) of the Lagrangian, we get the dual objective:
g(α,β)=inf⁡wϕ2w′Σw−(μ−α−βe)′w−β−ρλ∗(α)g(\alpha, \beta)=\inf_w \frac{\phi}{2}w'\Sigma w-(\mu-\alpha-\beta e)'w-\beta-\rho_\lambda^*(\alpha) g(α,β)=winf​2ϕ​w′Σw−(μ−α−βe)′w−β−ρλ∗​(α)
From the optimality condition for the infimum over www, we have
w∗=ϕ−1Σ−1(μ−α−βe)w^*=\phi^{-1}\Sigma^{-1}(\mu-\alpha-\beta e) w∗=ϕ−1Σ−1(μ−α−βe)
Also,
ρλ∗=sup⁡v{αTv−ρλ(v)}={0α∈Cλ\rho_\lambda^*=\sup_v\{\alpha^Tv-\rho_\lambda(v)\}= \begin{cases} 0 & \alpha\in C_\lambda\\ \end{cases} ρλ∗​=vsup​{αTv−ρλ​(v)}={0​α∈Cλ​​
where Cλ:={v:Rk,ρλD(v)≤1}C_\lambda:=\{v:\mathbb{R}^k, \rho_\lambda^D(v)\leq 1\}Cλ​:={v:Rk,ρλD​(v)≤1} is the unit sphere defined in the dual norm. Plugging-in these, we get the dual problem:
max⁡α,β−12ϕ(μ−α−βe)′Σ−1(μ−α−βe)−β\max_{\alpha, \beta} -\frac{1}{2\phi}(\mu-\alpha-\beta e)'\Sigma^{-1}(\mu-\alpha-\beta e)-\beta α,βmax​−2ϕ1​(μ−α−βe)′Σ−1(μ−α−βe)−β
Estimate the primal-dual gap as follows:
G=12ϕ(w∗)Σw∗−μ′w∗+ρλ(w∗)+12ϕ(μ−α∗−β∗e)′Σ−1(μ−α∗−β∗e)+β∗=−(α∗+βe)′w∗+β∗+ρ+λ(v∗)\begin{aligned} G &= \frac{1}{2}\phi(w^*)\Sigma w^*-\mu'w^*+\rho_\lambda(w^*)+\frac{1}{2\phi}(\mu-\alpha^*-\beta^*e)'\Sigma^{-1}(\mu-\alpha^*-\beta^*e)+\beta^*\\ &=-(\alpha^*+\beta e)'w^*+\beta^*+\rho+\lambda(v^*) \end{aligned} G​=21​ϕ(w∗)Σw∗−μ′w∗+ρλ​(w∗)+2ϕ1​(μ−α∗−β∗e)′Σ−1(μ−α∗−β∗e)+β∗=−(α∗+βe)′w∗+β∗+ρ+λ(v∗)​

Reference

Sparse portfolio selection via the sorted l1l_1l1​-Norm

【ADMM】ADMM Gap相关推荐

  1. 【IoT】蓝牙 GAP 和 GATT 协议简析

    文章背景: 理论知识是实践开发的基础,对于产品研发来说更是如此,理论结合实践才可以开发出满足市场需求的稳定产品. 1.基础简介 1.1.profile profile 可以理解为一种规范,一个标准的通 ...

  2. 【DG】 DataGuard 中处理archive gap的方法

    [DG] DataGuard 中处理archive gap的方法 DG 中处理archive gap的方法 ==================== 当Primary Database的某些日志没有成 ...

  3. Ubuntu上mysql的安装及使用【转】

    原创 Ubuntu上mysql的安装及使用 2019-02-10 13:54:24 baiduoWang 阅读数 196更多 分类专栏: Linux MySql 版权声明:本文为博主原创文章,遵循 C ...

  4. 【Math】P=NP问题

    文章目录 **P vs NP** **0 P=NP基本定义** 0.1 Definition of NP-Completeness 0.2 NP-Complete Problems 0.3 NP-Ha ...

  5. P4722 【模板】最大流

    P4722 [模板]最大流 加强版 / 预流推进 今日心血来潮,打算学习hlpp 然后学了一阵子.发现反向边建错了.容量并不是0.qwq 然后就荒废了一晚上. 算法流程的话.有时间补上 #includ ...

  6. 洛谷P2057 【SHOI2007】善意的投票

    洛谷P2057 [SHOI2007]善意的投票 题目链接 这道题是最小割的一个经典应用:划分集合. 题目的意思就是就是将所有的小朋友分为两个集合:同意睡觉和不同意睡觉的.不同的集合之间的边都要断开. ...

  7. ioremap 与 mmap【转】

    转自:http://blog.csdn.net/junllee/article/details/7415732 内存映射 对于提供了MMU(存储管理器,辅助操作系统进行内存管理,提供虚实地址转换等硬件 ...

  8. 【控制】多智体系统一致性基础知识

    多智体控制 多智体一致性控制 图论 1. 无向图.有向图.同构图 2. 邻接表.邻接矩阵.关联矩阵 3. 连通性 图论矩阵 1. 度矩阵 2. 邻接矩阵 3. 拉普拉斯矩阵 4. 拉氏矩阵的性质 5. ...

  9. 【分布式计算】DFS BigTable

    1.背景 分布式计算的发迹应该是google在2003年发表的三篇paper,分别是GFS.MapReduce.BigTable.其中MapReduce大家都很熟悉了,不懂的同学也可以看看我之前写的文 ...

  10. 【NLP】XLnet:GPT和BERT的合体,博采众长,所以更强

    前面介绍过BERT,作为一种非常成功的预训练模型,取得了非常不错的成绩,那么,他还有改进的空间吗? 本文介绍BERT的改进版,XLnet.看看它用了什么方法,改进了BERT的哪些弱点. 作者& ...

最新文章

  1. 构建更好的敏捷项目管理组织所需的4种工具
  2. PyTorch Upsample() 函数实现上采样
  3. 利用Cobbler批量快速网络安装CentOS
  4. 美国36%流量背后 Netflix CDN分发算法优化
  5. 银行计算机设备日常检查表,[计算机]201154安全检查表.doc
  6. comsol 多物理场仿真流程-以开关柜为例
  7. java运算符使用总结_Java运算符知识点总结
  8. html图片右上角关闭按钮,jQuery UI:datepicker – 如何在右上角添加关闭按钮(图像!)?...
  9. [Python Study Notes]pandas.DataFrame.plot()函数绘图
  10. 《薄世宁医学通识讲义》笔记
  11. 企业收费邮箱如何选择及好处
  12. HTML5 标签大全
  13. 尽早取出住房公积金是明智选择
  14. 珞珈-B生所学 跟学笔记 PPT(一)
  15. CentOS8中如何支持TL-WDN7200H无线USB网卡?
  16. 贵有恒,何必三更起五更眠;最无益,只怕一日曝十日寒
  17. java数据类型有哪些(给博主倒一杯卡布奇诺)
  18. jstree 使用API
  19. node 项目打包工具ncc
  20. 连连看核心算法与基本思想(附全部项目代码链接与代码详细注释)

热门文章

  1. api. feel.ai_如何使用Api.ai构建自己的AI助手
  2. lomboz eclipse怎么连接oracle10,Lomboz插件的安装与配置[Eclipse 3.0,3.1.x与3.2.x版本]第一部分...
  3. 当电子工程师十余年,感慨万千
  4. fedora安装字体
  5. .NET Core(.NET 6)控制台应用程序与MongoDB Atlas入门示例教程详解
  6. Xenu-死链接检测工具
  7. 最全面测试计划书模板
  8. java网上订餐系统开题报告_基于WEB的网上订餐系统-开题报告.doc
  9. 计算机文献检索试题及答案,文献检索试题及答案.doc
  10. 【线性代数】理解正定矩阵和半正定矩阵