凸优化笔记 —— 基本概念之凸集

  • 1. 数学优化
  • 基本概念
    • 2.1 凸优化问题
    • 2.2 线性函数与凸函数
    • 2.3 凸集
      • 仿射集。
      • 2.3.2 凸集
    • 2.3.3锥
    • 三种集合的比较:

基本准备

本科没学过凸优化,想趁着还不是太忙,恶补下数学知识,终究是绕不过去的山。应该会不定时的更新凸优化、矩阵论的相关笔记吧,PRML、计算机视觉、概率图模型希望以后也能写一写笔记。

推荐的书籍:
英文版《Convex Optimization》
中文版(译本)《凸优化》(清华出版社)

推荐视频:
前中科大 凌青老师 (现在好像去了中山大学了)
视频在线地址:b站
网盘下载地址:http://pan.baidu.com/s/1slmHdTz 密码:9h61 (感谢,大智能时代’s Archiver上的分享)

纸质版书的话,英文版有点贵,中文版还好。PDF的话,上面我都给了链接了,英文版是作者的主页,可以免费下载最新版的PDF,中文版好像不是太新。视频的话,在线可以去b站上,下载的话也有网盘地址。不得不说b站真是个神奇的网站,很多斯坦福公开课我也是在上面看的,但是好像现在CS231N找不到。咳咳,扯远了~

另外,为了节省写博客的时间,书上的概念、公式会以截图的形式贴到博客上,重点在于自己的理解,和重点知识的归纳。书归正传,开始基本概念的笔记吧。

1. 数学优化

优化,即在可行解的范围内,找出最优解。用数学的形式可表达如下:
minimize  f0(x)subject to  fi(x)≤bi,  i=1,⋯ ,mminimize\: \: f_0\left ( x \right )\\ subject \:to\: \: f_i\left ( x \right )\leq b_i, \: \: i = 1,\cdots ,mminimizef0​(x)subjecttofi​(x)≤bi​,i=1,⋯,m

,其中,向量x是问题的优化变量,f0f_0f0​是目标函数,fif_ifi​是约束函数。关于这个公式具体的定义如书上所言:


同样,也给出了最优解的概念。另外,目标函数和约束函数并不一定是单一的,都是可以存在多个的。

其实,对于数学优化问题,具体来点讲,比如在用做物理实验或者各种实验获得的数据,来拟合这些数据所表征的函数。假设,这些数据表征的是一个二次函数,即y=ax2+bx+cy=ax^2+bx+cy=ax2+bx+c,在计算机上去拟合只能是去,先有个a、b、c的初始值,带入上述这个形式中,看与真实值的误差多大,然后向着是误差减小的地方来更新a、b、c的值,(有点类似于反向传播)。在这其中,误差就是目标函数,而限制条件,可能就是这些数据都是非负的,等等。优化问题的求解就是在一定的精度内,满足此一实例。就如上面这个问题,当误差在某一阈值之内的时候,求解就算完毕。

希尔伯特说过,问题可被描绘出来,就解决的了80%。而如果优化问题,能被描述出来还能被转换成凸优化问题,那么问题就解决了90%(凌青老师的话)

优化的分类

分类大概为:凸优化与非凸优化,线性优化与非线性优化,(针对目标函数)光滑与非光滑,连续与离散,多目标与单目标等。其中凸优化与非凸优化是界定优化问题较为准确地分界。粗略来讲,凸问题是较为简单的问题,非凸问题是较为难的问题。

基本概念

2.1 凸优化问题

什么是凸优化呢,简单来讲,就是上述数学优化问题中,目标函数是凸函数,约束问题属于凸集,或者是由若干凸函数组成的。那么,什么又是凸函数和凸集呢?

2.2 线性函数与凸函数

① 线性函数的定义:
fi(αx+βy)=αfi(x)+βfi(x)f_i\left ( \alpha x+\beta y \right )=\alpha f_i\left ( x \right )+\beta f_i\left ( x \right )fi​(αx+βy)=αfi​(x)+βfi​(x)
其中,α, β∈R\alpha,\: \beta \in Rα,β∈R

② 凸函数的定义:
fi(αx+βy)≤αfi(x)+βfi(x)f_i\left ( \alpha x+\beta y \right )\leq \alpha f_i\left ( x \right )+\beta f_i\left ( x \right )fi​(αx+βy)≤αfi​(x)+βfi​(x)其中,α, β∈R+,且α+β=1\alpha,\: \beta \in R^+,且\alpha+\beta =1α,β∈R+,且α+β=1

可以看出,线性函数属于凸函数,也就是说凸优化是比线性优化更为一般的问题。

2.3 凸集

仿射集。

第一种定义:


要注意,这个定义中需要是过集合内任意两点的直线,还在集合内。那,什么是直线呢?数学表达如下:

当把,Θ\ThetaΘ设定在[0,1]之间时,直线就变成了了线段。下面这张图就很好地解释了这件事,Θ\ThetaΘ的绝对值越来越大时,点就会离Θ\ThetaΘ为0的点越来越远,而Θ\ThetaΘ属于[0,1]时,也就只能包含x1x_1x1​和x2x_2x2​之间的点了。


仿射组合与第二种定义:

翻译过来就是,根据上面定义的仿射组合,如果对于仿射集C内任意个点的仿射组合都还属于C。这两种定义是等价的,证明省略,有兴趣可以看凌青老师视频第三集,证明也较为简单。

(1) 仿射集相关的子空间

另外,在仿射集的定义中,要求所有系数相加为1。那么是否有α, β∈R\alpha,\: \beta \in Rα,β∈R,而对于任意的点,αx1+βx2\alpha x_1+\beta x_2αx1​+βx2​仍然属于C的情况呢?考虑一条穿过原点的直线,这样一个集合就是满足上述这样的性质的。

更普遍的来讲,不管在任意维度的空间内,一个集合的点只要统统减去集合内的值,那么这个集合一定经过空间内的原点。那么可以构造出一个与仿射集相关的子空间V:

同样V,也是一个仿射集,且αv1+βv2\alpha v_1+\beta v_2αv1​+βv2​仍然属于C。

(2) 线性方程的解

上述图片中证明了,仿射集必定是线性方程组的解集。结合上面的子空间的定义,可以清楚的看到,以C为解集的线性方程组,其中A·V必定等于0,即V是A的化零空间。

(3) 仿射包

其中,集合C若为仿射集,那么aff C就是其本本身,若C不是仿射集,那么aff C是包含C的最小的仿射集。

2.3.2 凸集

第一种定义:

从第一种定义的对比来看,仿射集限制要比凸集要大,满足线段在集合内要比满足直线在集合内要容易一些,这也是凸集包含仿射集的原因。

凸组合与第二种定义

在此不过多阐述,可以看一下较为明显的凸集和非凸集:

(1)凸包
与仿射包的定义相似,凸包的定义如下:

同样,如果C本身是凸集,那么conv C就是其本身,如果C不是凸集,那么conv C就是包含C的最小凸集。

2.3.3锥


其实,锥就是一系列射线,且射线的端点在原点处组合而成的集合,而本身又是凸集的锥就是凸锥。从上述定义的来说,构成的是一个扇面。如下图:


凸锥组合与凸锥包

三种集合的比较:

仿射集:Θ1x1+⋯+Θkxk,\Theta_1x_1+\cdots+ \Theta_kx_k,Θ1​x1​+⋯+Θk​xk​,    \; \; 其中,Θ1+⋯+Θk=1\Theta_1+\cdots +\Theta_k=1Θ1​+⋯+Θk​=1

凸集:Θ1x1+⋯+Θkxk,\Theta_1x_1+\cdots +\Theta_kx_k,Θ1​x1​+⋯+Θk​xk​,    \; \; 其中,Θ1+⋯+Θk=1,    Θ1,⋯ ,Θk∈[0,1]\Theta_1+\cdots +\Theta_k=1,\; \;\Theta_1,\cdots ,\Theta_k\in[0,1]Θ1​+⋯+Θk​=1,Θ1​,⋯,Θk​∈[0,1]

凸锥:Θ1x1+⋯+Θkxk,\Theta_1x_1+\cdots +\Theta_kx_k,Θ1​x1​+⋯+Θk​xk​,    \; \; 其中,Θ1,⋯ ,Θk∈R+\Theta_1,\cdots ,\Theta_k\in R^+Θ1​,⋯,Θk​∈R+

凸优化笔记(1) —— 基本概念相关推荐

  1. 【凸优化笔记一】仿射集+凸集+锥

    [凸优化笔记一]仿射集+凸集+锥 引言 直线&线段 直线的定义 线段的定义 仿射集 Affine Sets 与C相关的子空间 线性方程组的解集是仿射集 零空间 仿射包 Affine Hull ...

  2. 中科大-凸优化 笔记(lec25)-等价变换

    全部笔记的汇总贴(视频也有传送门):中科大-凸优化 ∇fT(x∗)(y−x)≥0\nabla f^T(x^*)(y-x)\ge0∇fT(x∗)(y−x)≥0线性规划的解在边界上 一.等价变换 例:食谱 ...

  3. 【凸优化笔记二】凸函数基本性质和例子

    [凸优化笔记二]凸函数基本性质和例子 凸函数的四个定义 定义一 定义二 定义三 定义四 一些栗子 凸函数的四个定义 定义一 其中 dom fff 是函数 fff 的 定义域(前域),为凸集--这个很重 ...

  4. 中科大-凸优化 笔记(lec9)-广义不等式、分离与支撑超平面、对偶锥与广义不等式

    全部笔记的汇总贴(这一节的视频缺失):中科大-凸优化 内容是自己看书上的三节整理的,和前面几节一样,算是一些基础性的理论知识. 只能说这一块儿先就这样,后面的课程如果遇到需要进行补充学习的地方,再进行 ...

  5. 中科大-凸优化 笔记(lec44)-一些上界下界及梯度下降

    全部笔记的汇总贴(视频也有传送门):中科大-凸优化 一.强凸性 假设 f ( x ) f(x) f(x)二阶可微且有强凸性 ∃ m > 0 , ∀ x ∈ d o m f , ∇ 2 f ( x ...

  6. 机器学习数据挖掘笔记_15(关于凸优化的一些简单概念)

    没有系统学过数学优化,但是机器学习中又常用到这些工具和技巧,机器学习中最常见的优化当属凸优化了,这些可以参考Ng的教学资料:http://cs229.stanford.edu/section/cs22 ...

  7. 关于凸优化的一些简单概念

    http://www.cnblogs.com/tornadomeet/p/3300132.html 没有系统学过数学优化,但是机器学习中又常用到这些工具和技巧,机器学习中最常见的优化当属凸优化了,这些 ...

  8. [转]关于凸优化的一些简单概念

    没有系统学过数学优化,但是机器学习中又常用到这些工具和技巧,机器学习中最常见的优化当属凸优化了,这些可以参考Ng的教学资料:http://cs229.stanford.edu/section/cs22 ...

  9. 凸优化一(基本概念介绍)

    背景知识 优化问题 凸优化是一类数学优化问题,介绍凸优化前先简单介绍数学优化问题. 优化问题定义(形式): minimizef0minimizef0 minimize \quad f_{0} subj ...

最新文章

  1. origin做主成分分析图_如何用SPSS做主成分分析?学习资料集锦
  2. EPROCESS ETHREAD简介
  3. (Spring)依赖注入
  4. IOS 项目名称修改(XCODE4.6)
  5. c语言怎么让字母倒序排列尼,如何倒序单词顺序输出 ? 我是没辙了
  6. 栈溢出笔记1.8 字符串问题
  7. java set集合转数组_java set转list,数组与list的转换
  8. Qt下拉对话框 ComboBox的用法
  9. NYOJ 40 公约数和公倍数
  10. CloudFlare Full SSL Strict 报错提示 Error 525 SSL handshake failed
  11. 【跨境电商学习指南】
  12. iPhone 5福音 网友发布Nano-SIM剪卡教程
  13. Fbank特征与MFCC特征解析
  14. python selenium 点击加载更多_Python Selenium 疑难杂症解方(三): 点击
  15. 华为系统和计算机,电脑手机合二为一 华为多屏协同让电脑与手机亲密互动
  16. 0320-复利计算器代码
  17. 微软培训和认证的建议
  18. 哈尔滨理工大学第七届程序设计竞赛初赛(低年级组)
  19. 宠辱不惊,看庭前花开花落;去留无意,望天空云卷云舒
  20. vue 动态的设置页面的高和宽,适配浏览器的缩放比

热门文章

  1. 基于单片机的饮水机温度控制系统、基于单片机继电器及双向可控硅控制照明设备、基于单片机的液位自动检测控制仿真设计、基于单片机家用厨房天然气火灾报警器系统-设计全套资料
  2. 原始套接字头结构定义
  3. [图像形态学操作]——腐蚀和膨胀、开闭运算、黑帽礼帽
  4. 高德离线地图WMS/WMTS服务
  5. 利用宽乐通信实现PHP网页收发短信
  6. java和sql网上书店系统_网上书店管理系统(java。SQL Server数据库)
  7. s7300的db块详细说明_(转载)一张表搞清楚西门子S7系列标准DB块与优化DB块
  8. python画图、python小游戏、python刷题、python算法、python编程与数学
  9. Java 后端将上传的 csv 文件转为 Excel xlsx 文件
  10. tkinter-listbox详解