对于RnR^n中的子集CC,当x∈C,y∈C,0<λ<1x\in C,y\in C,0 时,(1−λ)x+λy∈C(1-\lambda)x+\lambda y\in C,那么我们说集合CC是凸的。所以仿射集(包括∅\emptyset和RnR^n本身)是凸的,之所以凸集比仿射集更普遍是因为对于不同的点x,yx,y,凸集只包含通过x,yx,y直线的一部分,也就是

{(1−λ)x+λy|0≤λ≤1}

\{(1-\lambda)x+\lambda y|0\leq\lambda\leq1\}

这部分叫做x,yx,y之间的(闭)线段,例如R3R^3中的实心椭球和立方体是凸的但不是仿射的。

半平面是非常重要的凸集,对于任意非零b∈Rn,β∈Rb\in R^n,\beta\in R,集合

{x|⟨x,b⟩≤β},{⟨x,b⟩≥β}

\{x|\langle x,b\rangle\leq\beta\},\quad \{\langle x,b\rangle\geq\beta\}

为闭半空间,集合

{x|⟨x,b⟩<β},{⟨x,b⟩>β}

\{x|\langle x,b\rangle\beta\}

为开半空间。这四个集合是非空的并且是凸的,注意如果b,βb,\beta被λb,λβ\lambda b,\lambda\beta替换后得到的四个半空间跟之前是一样的,其中λ≠0\lambda\neq0,由此可知这些半空间只取决于超平面H={x|⟨x,b⟩=β}H=\{x|\langle x,b\rangle=\beta\}(定理1.3),所以给定一个超平面,我们可以明确的说出其对应的开和闭半空间。

定理2.1 任意个凸集的交集是凸的。

推论2.1.1 令bi∈Rn,βi∈Rb_i\in R^n,\beta_i\in R,其中i∈Ii\in I,II是任意一个索引集,那么集合

C={x∈Rn|⟨x,bi⟩≤βi,∀i∈I}

C=\{x\in R^n|\langle x,b_i\rangle\leq\beta_i,\forall i\in I\}

是凸的。

证明:令Ci={x|⟨x,bi⟩≤βi}C_i=\{x|\langle x,b_i\rangle\leq\beta_i\},那么CiC_i是一个闭半空间或者RnR^n或者∅\emptyset,而C=∩i∈ICiC=\cap_{i\in I}C_i。||||

当然,如果推论中的不等式≤\leq换成≥,>,<\geq,>,或者==,结论依然成立,因此给定一个含nn个变量的联立线性不等式和等式组,解集CC就是RnR^n中的凸集,这在理论和应用中都是一个重要的事实。

推论2.1.1将会被之后介绍的推论4.6.1推广。

可以表示成有限多个RnR^n闭半空间交集的集合称作多面体(polyhedral)凸集,这种集合比一般的凸集具有更好的性质,主要在于他们没有曲率。在19节将会介绍多面体凸集理论,另外,对于研究有限多个联立线性方程组和弱线性不等式组该理论依然适用。

对于向量和

λ1x1+⋯+λmxm

\lambda_1x_1+\cdots+\lambda_mx_m

如果系数λi\lambda_i都是非负的并且λ1+⋯+λm=1\lambda_1+\cdots+\lambda_m=1,那么该向量和称为x1,…,xmx_1,\ldots,x_m的凸组合。在应用数学中,很多总情况都会出现凸组合,λ1,…,λm\lambda_1,\ldots,\lambda_m可以解释为概率或比例。例如mm个质量为α1,…,αm\alpha_1,\ldots,\alpha_m的粒子位于R3R^3中的点x1,…,xmx_1,\ldots,x_m处,那么整个系统的重心就是点λ1x1+⋯+λmxm\lambda_1x_1+\cdots+\lambda_mx_m,其中λi=αi/(α1+⋯+αm)\lambda_i=\alpha_i/(\alpha_1+\cdots+\alpha_m)。在这个凸组合中,λi\lambda_i是xix_i质量与整个质量的比例。

定理2.2 对于RnR^n的一个子集,当且仅当它包含其元素的所有凸组合时,这个子集是凸的。

证明:事实上,根据定义,对于集合CC,当且仅当x1∈C,x2∈C,λ1≥0,λ2≥0,λ1+λ2=1x_1\in C,x_2\in C,\lambda_1\geq0,\lambda_2\geq0,\lambda_1+\lambda_2=1 时,λ1x1+λ2x2∈C\lambda_1x_1+\lambda_2x_2\in C恒成立,那么集合CC是凸的。也就是说,CC是凸的意味着在m=2m=2时,集合CC 对凸组合运算是封闭的,因此我们必须说明这暗含着在m>2m>2 时CC对凸组合运算也是封闭的。现在任取m>2m>2,利用归纳假设即CC对于小于mm个向量的所有凸组合封闭,我们给出CC 的一个凸组合x=λ1x1+⋯+λmxmx=\lambda_1x_1+\cdots+\lambda_mx_m,其中至少有一个系数λi\lambda_i不等于1(否则的话λ1+⋯+λm=m≠1\lambda_1+\cdots+\lambda_m=m\neq1);为了方便起见,令其为λ1\lambda_1,令

y=λ′2x2+⋯+λ′mxm,λ′i=λi/(1−λ1)

y=\lambda_2^{'}x_2+\cdots+\lambda_m^{'}x_m,\quad \lambda_i^{'}=\lambda_i/(1-\lambda_1)

那么对于i=2,…,m,λi≥0i=2,\ldots,m,\lambda_i\geq0,并且

λ′2+⋯+λ′m=(λ2+⋯+λm)/(λ2+⋯+λm)=1

\lambda_2^{'}+\cdots+\lambda_m^{'}=(\lambda_2+\cdots+\lambda_m)/(\lambda_2+\cdots+\lambda_m)=1

那么yy是CC中m−1m-1个元素的凸组合,根据归纳假设y∈Cy\in C。因为x=(1−λ1)y+λ1x1x=(1-\lambda_1)y+\lambda_1x_1,所以x∈Cx\in C。||||

包含所有RnR^n子集SS的凸组合的交集称为SS的凸包,用conv S\ S表示,根据定理2.1可知它是凸集,是包含SS的最小凸集。

定理2.3 对于所有的S∩RnS\cap R^n,conv S\ S包含SS的所有凸组合。

证明:SS的元素属于conv S\ S,所以根据定理2.2,他们的所有凸组合属于conv S\ S。另一方面,给定两个凸组合x=λ1x1+⋯+λmxmx=\lambda_1x_1+\cdots+\lambda_mx_m和y=μ1y1+⋯+μryry=\mu_1y_1+\cdots+\mu_ry_r,其中xi∈S,yj∈Sx_i\in S,y_j\in S,那么向量

(1−λ)x+λy=(1−λ)λ1x1+⋯+(1−λ)λmxm+λ1μ1y1+⋯+λrμryr

\begin{align*} (1-&\lambda)x+\lambda y\\ &=(1-\lambda)\lambda_1x_1+\cdots+(1-\lambda)\lambda_mx_m+\lambda_1\mu_1y_1+\cdots+\lambda_r\mu_ry_r \end{align*}

是SS的另一个凸组合,其中0≤λ≤10\leq\lambda\leq1。由此可知,SS凸组合组成的集合其本身就是一个凸集,另外它包含SS,所以它肯定和最小凸集(conv S\ S) 是一致的。||||

实际上,对于定理2.3,我们可以一次考虑n+1n+1个或更少元素的凸组合,这个重要的改进将会在17节进行证明,也就是所谓的Caratheodory定理另一个关于定理2.3的改进会在定理3.3中给出。

推论2.3.1 RnR^n中有限个子集{b0,…,bm}\{b_0,\ldots,b_m\}的凸包由所有形如λ0b0+⋯+λmbm\lambda_0b_0+\cdots+\lambda_mb_m的向量组合,其中λ0≥0,…,λm≥0,λ0+⋯+λm=1\lambda_0\geq0,\ldots,\lambda_m\geq0,\lambda_0+\cdots+\lambda_m=1。

证明:所有从{b0,…,bm}\{b_0,\ldots,b_m\}中选出元素产生的凸组合可以表示成b0,…,bmb_0,\ldots,b_m的凸组合,对于那些没有用到的向量bib_i,可以将其系数置为0。||||

如果集合是有限多个点的凸包,那么我们称该集合为多面体。如果{b0,b1,…,bm}\{b_0,b_1,\ldots,b_m\}是仿射无关的,那么它的凸包叫做mm维单纯形,并且b0,…,bmb_0,\ldots,b_m叫做单纯形的顶点。在aff{b0,b1,…,bm}\{b_0,b_1,\ldots,b_m\}上用重心坐标表示的话,单纯形的每个点都可以唯一地表示成顶点的凸组合,λ0=⋯=λm=1/(1+m)\lambda_0=\cdots=\lambda_m=1/(1+m)的点λ0b0+⋯+λmbm\lambda_0b_0+\cdots+\lambda_mb_m叫做单纯形的中点或者重心,当m=0,1,2,3m=0,1,2,3时,单纯形分别是点,(闭)线段,三角形或四面体。

一般情况下,凸集CC的维数就是CC仿射包的维数,因此对于一个凸圆盘而言,无论它被嵌入到几维的空间,它的维数都是二。(仿射集或单纯形的维数与他们作为凸集时的维数一样)下面的事实将会用于第6节的证明,也就是非空凸集具有非空的相对内点。

定理2.4 凸集CC的维数是所有含与CC中单纯形的最大值维数。

证明:CC任意子集的凸包都含在CC中,所有含于CC单纯形的最大维数是mm,使得CC包含一个含有m+1m+1个元素的仿射无关集。令{b0,b1,…,bm}\{b_0,b_1,\ldots,b_m\}是有mm个极大值的集合,并且零MM是仿射包,那么dimM=m,M∈affC\dim M=m,M\in \text{aff}C,更进一步C∈MC\in M,因为如果C∖MC\backslash M 包含元素bb,那么CC中m+2m+2个元素b0,…,bm,bb_0,\ldots,b_m,b 集合僵尸仿射无关的,这与最大值mm矛盾。(即,aff{b0,…,bm,b}\{b_0,\ldots,b_m,b\}将包含MM,因此将超过mm 维)因为aff C{\ C} 是包含CC的最小仿射集,所以aff C=M\text{aff}\ C=M,由此得出dimC=m\dim C=m。||||

对于RnR^n的子集KK,如果它对于正标量乘法封闭,即当x∈K,λ>0x\in K,\lambda>0时λx∈K\lambda x\in K,那么该集合叫做锥。这样的集合是从原点发出射线的并,该集合可能包含原点,也可能不包含。当锥还是一个凸集的时候我们成它为凸锥,(注意,许多作者在KK含有原点的时候才成为凸锥,因此,对于这些作者而言,凸锥就是对非负标量乘法封闭的非空凸集。)

我们不该认为凸锥就是尖的,尤其是RnR^n的子空间就是凸锥,对于通过原点的超平面,它多对应的开和闭半空间也是凸锥。

两个最重要的凸锥就是RnR^n的非负象限

{x=ξ1,…,ξn|ξ1≥0,…,ξn≥0}

\{x={\xi_1,\ldots,\xi_n}|\xi_1\geq0,\ldots,\xi_n\geq0\}

和正象限

{x=ξ1,…,ξn|ξ1>0,…,ξn>0}

\{x={\xi_1,\ldots,\xi_n}|\xi_1>0,\ldots,\xi_n>0\}

这些锥在不等式理论中都是很有用的,习惯上如果x−x′x-x^{'}属于非负象限,我们就写作x≥x′x\geq x^{'},即

ξj≥ξ′j,j=1,…,n.

\xi_j\geq\xi_j^{'},\quad j=1,\ldots,n.

利用这个符号,非负象限由向量xx组成,其中x≥0x\geq0。

定理2.5 任意个凸锥的交集是凸锥。

推论2.5.1 对于i∈Ii\in I,令bi∈Rnb_i\in R^n,其中II是一个任意的索引集,那么

K={x∈Rn|⟨x,bi⟩≤0,i∈I}

K=\{x\in R^n|\langle x,b_i\rangle\leq0,i\in I\}

是一个凸锥。

证明:如同推论2.1.1。||||

当然,推论2.5.1中的≤\leq可能用≥,>,<\geq,>,或者==替换,因此如果线性不等式是齐次的话,它的解集是一个凸锥,而不仅仅是凸集。

下面介绍的凸锥特征强调的是凸锥和子空间的相似性。

定理2.6 对于RnR^n的一个子集,当且仅当它对加法和正标量乘法封闭时,这个子集是凸锥。

证明:令KK是一个锥,x∈K,y∈Kx\in K,y\in K,如果KK是凸的,那么向量z=(1/2)(x+y)z=(1/2)(x+y)属于KK,因此x+y=2z∈Kx+y=2z\in K。另一方面,如果KK对加法封闭,并且0<λ<10,那么向量(1−λ)x,λy(1-\lambda)x,\lambda y属于KK,于是(1−λ)x+λy∈K(1-\lambda)x+\lambda y\in K,因此当且仅当它对加法封闭时KK是凸的。||||

推论2.6.1 对于RnR^n的一个子集,当且仅当它包含其元素的所有正线性组合时(即线性组合λ1x1+⋯+λmxm\lambda_1x_1+\cdots+\lambda_mx_m,其中系数都是正的),该集合是凸锥。

推论2.6.2 令SS是RnR^n的任意子集,并且令KK是SS中所有正线性组合的集合,那么KK是包含SS的最小凸锥。

证明:很明显KK对加法和正标量乘法封闭,并且K⊃SK\supset S,另一方面,每个包含SS的凸集肯定包含KK。||||

当SS是凸集时,更简单的描述如下

推论2.6.3 令CC是凸集,并且

K={λx|λ>0,x∈C}

K=\{\lambda x|\lambda>0,x\in C\}

那么KK是包含CC的最小凸锥。

证明:这个结论可以根据前面的推论得出。即,CC中元素的所有正线性组合是CC中元素的凸组合乘以正标量值,也就是KK中的元素。||||

推论2.6.2(或者推论2.6.3)中,通过将原点伴随到锥中而得到的凸锥就是所谓由SS生成的凸锥,用cone S\ S表示。(因此在我们的定义中,由SS生成的凸锥和包含SS的最小凸锥是不一样的,除非后者正好包含原点。)如果S≠∅S\neq\emptyset,cone S\ S由SS的所有非负(不是正)线性组合组成,显然

cone=conv(ray S)

\text{cone}=\text{conv}(\text{ray}\ S)

其中ray S\ S是原点和非零向量y∈Sy\in S产生的不同射线(形如{λy|λ≥0}\{\lambda y|\lambda\geq0\}的射线)的并。

就像椭圆盘可以看成实心圆锥的某个横截面一样,RnR^n中的每个凸集CC可以看成Rn+1R^{n+1}中某个凸锥KK的横截面。事实上,令KK表示Rn+1R^{n+1}中集合(1,x)(1,x)生成的凸锥,其中x∈Cx\in C,那么KK是由Rn+1R^{n+1}的原点和(λ,λx)(\lambda,\lambda x)组成的,其中λ>0,x∈C\lambda>0,x\in C。KK和超平面{(λ,y|λ=1)}\{(\lambda,y|\lambda=1)\}的交可以视为CC,依据这个事实,我们可以从对应的(通常更加简单)凸锥定理中推断出凸集定理。

对于凸集CC在点aa处的向量x∗x^*,如果x∗x^*和CC中以aa 为端点的所有直线夹角不是锐角,即对每个x∈C,⟨x−a,x∗⟩≤0x\in C,\langle x-a,x^*\rangle\leq0,那么就称x∗x^*是法向量。例如,如果CC是半空间{x|⟨x,b⟩≤β}\{x|\langle x,b\rangle\leq\beta\}并且aa 满足⟨a,b⟩=β\langle a,b\rangle=\beta,那么bb是CC在aa 处的法向量。一般来说,CC在aa处的所有法向量x∗x^*组成的集称为CC在aa处的法锥(normal cone),很容易证实这个锥一直是凸的。

另一个容易证实的凸锥实例是凸集CC的屏障锥(barrier cone),也就是对于每个x∈Cx\in C,存在β∈R\beta\in R,使得⟨x,x∗⟩≤β\langle x,x^*\rangle\leq\beta的所有向量x∗x^*的集合。

每个包含0的凸锥都和一对子空间相关联,具体如下所示。

定理2.7 令KK是包含0的凸锥,那么存在一个最小的包含KK的子空间,即

K−K={x−y|x∈K,y∈K}=aff K

K-K=\{x-y|x\in K,y\in K\}=\text{aff}\ K

并且有一个最大的含于KK的子空间,即(−K)∩K(-K)\cap K

证明:根据定理2.6,KK对加法和正标量乘法封闭。为了成为子集,进一步,集合还包含0并且对-1的乘法封闭,显然K−KK-K 是满足条件的最小集合(包含KK),(−K)∩K(-K)\cap K是满足条件的最大集合(含于KK)。前者肯定和aff K\ K一致,因为包含0的集合的仿射包是一个子空间(根据定理1.1)。||||

漫步凸分析二——凸集和锥相关推荐

  1. 漫步线性代数二——线性方程的几何形状

    漫步线性代数二--线性方程的几何形状 2016年08月15日 23:10:10 会敲键盘的猩猩 阅读数:1818 几何形状 理解这个主题的方法是举例说明.我们以两个极其简单的方程开始,可以说大家在没有 ...

  2. 漫步凸分析十一——分离定理

    令C1,C2C_1,C_2是RnR^n中的非空集合,有一个超平面HH,如果C1C_1含于其中的一个闭半空间而C2C_2含于相对立的闭半空间,那么我们称HH分离(separate)C1,C2C_1,C_ ...

  3. 漫步凸分析八——回收锥与无界

    RnR^n中的有界闭子集通常比无界的更容易处理,然而,当集合为凸时,无界的困难度就下降很多,这实在是一大幸事,因为我们考虑的许多集合像上境图从他们的性质可知是无界的. 根据我们的直观理解,无界闭凸集在 ...

  4. 漫步凸分析六——凸集的相对内点

    根据定义,RnR^n中点x,yx,y之间的欧几里得距离是 d(x,y)=|x−y|=⟨x−y,x−y⟩1/2 d(x,y)=|x-y|=\langle x-y,x-y\rangle^{1/2} 函数d ...

  5. 漫步凸分析五——函数运算

    对于已知的凸函数,我们如何对他们进行使得产生的函数依然是凸的呢?目前已经证明了许多运算是保留凸性的,某些运算与平常分析中的运算是类似的,像函数的逐点加法,还有一些运算出自几何动机,像取函数集的凸包.通 ...

  6. 漫步凸分析三——凸集代数

    有许多种代数运算可以保留凸性. 例如,如果CC是RnR^n中的凸集,那么所有平移操作C+aC+a和标量乘法λC\lambda C同样是凸集,其中 λC={λx|x∈C} \lambda C=\{\la ...

  7. 漫步数理统计二十二——二项及相关分布

    之前我们介绍了均匀分布与超几何分布,这篇文章我们讨论一些其他在统计中经常使用的分布,首先从二项与相关分布开始. 伯努利试验是一个随机试验,输出为两个相互独立且有穷中的一个,例如成功或失败(男或女,生或 ...

  8. 漫步数理统计二——集合论

    对象集合的概念通常还未定义,然而可以描述特定的集合使得我们考虑的对象集合没有歧义.例如前10个正整数的集合就非常清楚,34,14\frac{3}{4},14均不在这个集合中,而3在这个集合中.如果对象 ...

  9. 漫步凸分析七——凸函数闭包

    线性函数的凸性是代数性质(线性)的结果,而对于凸函数,事情就没那么简单了,但是凸函数本身依然有许多拓扑性质,通过将凸集的闭包和相对内点理论应用到凸函数的上境图或水平集上可以推出这些结论.有一个基本的结 ...

最新文章

  1. python怎么导入视频-python中的导入如何使用,以及.和..相对导入的使用
  2. oracle中匹配函数怎么用,ORACLE 使用正则表达式的函数
  3. 独立式环境与宿主式环境————《标准C语言指南》读书笔记01
  4. 新疆大学OJ(ACM) 1099: 数列有序!
  5. Codeforces Round #420 E
  6. java tm无响应_Java(TM) Platform SE binary 未响应 是怎么个情况?
  7. HALCON:如何结合面向对象和面向过程的代码
  8. Python 中非常狗的一个坑(在 `a={1:2},`后面多了一个逗号,自动被判为 tuple 类型了)
  9. 【转】Java杂谈(九)--Struts
  10. CVPR 2022NTIRE 2022|首个用于高光谱图像重建的 Transformer
  11. 20190608每日一句
  12. php fprintf,PHP fprintf() 函数 - PHP 教程 - 菜鸟学堂-脚本之家
  13. 《华为基本法》读书笔记
  14. Android 打包AAB+PAD(Unity篇)
  15. java实现根据身份证计算年龄的两种方式
  16. obsidian标题自动添加序号
  17. git push reject 解决方案
  18. BZOJ 4199 品酒大会
  19. A到Z的unicode的编码的大小
  20. 用PS制作墙壁上的时尚立体文字图案

热门文章

  1. Google大数据三论文
  2. C#调用天气预报网络服务
  3. Oracle 11g安装(window)的7个服务
  4. JSON返回的自定义
  5. 容器编排技术 -- Kubernetes kubectl rollout pause 命令详解
  6. 前端图片压缩上传(纯js的质量压缩,非长宽压缩)
  7. 【JAVA 第四章 流程控制语句】课后习题 直线斜率 以及判断坐标是否在直线上点到直线的距离
  8. 【HTML】底部弹窗插件代码
  9. 【Python】汉诺塔问题
  10. 敏捷开发 看板_什么是看板? 定义的敏捷方法论,以及如何将其用于您的软件开发团队