椭圆是一个凸集的证明

  • 常见的凸集
  • 椭圆是凸集的证明
    • 从定义上证明椭圆是一个凸集合
  • 从 norm 的角度去看 ellipsoid
    • Mahalanobis norm
    • 椭圆是一个 norm ball
  • 从仿射的角度看椭圆
  • 参考文献

常见的凸集

我们在 Affine set 和 convex set 的定义 一文中讲解了凸集(convex set)的概念。我们先来回顾一下凸集的定义:

如果连接集合 C C C 当中的任何两点构成的线段也在集合 C C C 之中,那么我们就说集合 C C C 是一个 convex set。

或者我们用数学的语言来描述:

对于集合 C C C 中的任何 x 1 , x 2 x_1, x_2 x1​,x2​,对任意 0 ≤ θ ≤ 1 0 \leq \theta \leq 1 0≤θ≤1,如果我们有 θ x 1 + ( 1 − θ ) x 2 ∈ C \theta x_1 + (1 - \theta) x_2 \in C θx1​+(1−θ)x2​∈C。我们就说这个集合是一个凸集合 (convex set)。

一些常见的是凸集的集合可以总结如下:

  1. 空集 ∅ \empty ∅。
  2. 只有一个元素的集合 { x 0 } \{x_0\} {x0​}。
  3. 整个 R n \mathbb{R}^n Rn 空间。
  4. 任意直线。
  5. 任意线段。
  6. R n \mathbb{R}^n Rn 中的任意线性空间。

上述的6个例子都是较为明显的凸集合的例子。在本文中我们将要重点看另外一个常见的例子,椭圆(ellipsoid)。

我们容易想象到,如果连接椭圆中的任意两点,那么得到的线段也将在椭圆中,所以椭圆自然是一个凸集合。

但是我们怎么从数学上严格得证明椭圆是一个凸集合呢?这就是本文将要讨论的问题。

椭圆是凸集的证明

从定义上证明椭圆是一个凸集合

我们先来看椭圆集合的数学定义。我们用集合

E = { x ∣ ( x − x c ) T P − 1 ( x − x c ) ≤ 1 } \mathscr{E} =\{x \vert (x - x_c)^T P^{-1} (x - x_c) \leq 1 \} E={x∣(x−xc​)TP−1(x−xc​)≤1}

表示椭圆。其中 P P P 是一个对称正定的矩阵。通常我们用 P ≻ 0 P \succ 0 P≻0 表示矩阵 P P P 是正定的。 x c ∈ R n x_c \in \mathbb{R}^n xc​∈Rn 称为椭圆的中心。

下面我们从定义上去证明 E \mathscr{E} E 这个集合是凸集合。

对于 ∀ x , y ∈ E \forall x, \, y \in \mathscr{E} ∀x,y∈E,以及任意 0 ≤ θ ≤ 1 0 \leq \theta \leq 1 0≤θ≤1,我们想要证明 θ x + ( 1 − θ ) y \theta x + (1 - \theta) y θx+(1−θ)y 也属于集合 E \mathscr{E} E。

因为 x , y ∈ E x, \, y \in \mathscr{E} x,y∈E,所以我们有
( x − x c ) T P − 1 ( x − x c ) ≤ 1 , ( y − x c ) T P − 1 ( y − x c ) ≤ 1 (x - x_c)^T P^{-1} (x - x_c) \leq 1, \\ (y - x_c)^T P^{-1} (y - x_c) \leq 1 (x−xc​)TP−1(x−xc​)≤1,(y−xc​)TP−1(y−xc​)≤1.

我们希望证明
( θ x + ( 1 − θ ) y − x c ) T P − 1 ( θ x + ( 1 − θ ) y − x c ) ≤ 1 ( ∗ ) (\theta x + (1 - \theta) y -x_c)^T P^{-1} (\theta x + (1 - \theta) y -x_c) \leq 1 \hspace{5cm} (*) (θx+(1−θ)y−xc​)TP−1(θx+(1−θ)y−xc​)≤1(∗)

我们把 ( ∗ ) (*) (∗) 式的左边展开,我们可以得到
LHS = θ 2 ( x − x c ) T P − 1 ( x − x c ) + ( 1 − θ ) 2 ( y − x c ) T P − 1 ( y − x c ) + ( 1 − θ ) θ ( y − x c ) T P − 1 ( x − x c ) + θ ( 1 − θ ) ( x − x c ) T P − 1 ( y − x c ) ≤ θ 2 + ( 1 − θ ) 2 + 2 θ ( 1 − θ ) ( x − x c ) T P − 1 ( y − x c ) \begin{aligned}\text{LHS} = & \theta^2 (x-x_c)^T P^{-1} (x - x_c) + \\ &(1 - \theta)^2 (y - x_c)^T P^{-1} (y - x_c) + \\ & (1 - \theta) \theta (y - x_c)^T P^{-1} (x - x_c) + \\ & \theta (1 - \theta) (x - x_c)^T P^{-1} (y - x_c) \\ \leq & \theta^2 + (1 - \theta)^2 + 2 \theta (1 - \theta) (x - x_c)^T P^{-1} (y - x_c) \end{aligned} LHS=≤​θ2(x−xc​)TP−1(x−xc​)+(1−θ)2(y−xc​)TP−1(y−xc​)+(1−θ)θ(y−xc​)TP−1(x−xc​)+θ(1−θ)(x−xc​)TP−1(y−xc​)θ2+(1−θ)2+2θ(1−θ)(x−xc​)TP−1(y−xc​)​.

这里我们应用了 P − 1 = ( P − 1 ) T P^{-1} = \left( P^{-1} \right)^T P−1=(P−1)T,并且 ( y − x c ) T P − 1 ( x − x c ) = ( x − x c ) T P − 1 ( y − x c ) (y - x_c)^T P^{-1} (x - x_c) =(x - x_c)^T P^{-1} (y - x_c) (y−xc​)TP−1(x−xc​)=(x−xc​)TP−1(y−xc​)。

所以为了证明 LHS ≤ 1 \text{LHS} \leq 1 LHS≤1,我们只须要证明 ( y − x c ) T P − 1 ( x − x c ) ≤ 1 (y - x_c)^T P^{-1} (x - x_c) \leq 1 (y−xc​)TP−1(x−xc​)≤1 即可。

因为 P ≻ 0 P \succ 0 P≻0 并且 P P P 是对称的,我们有 P − 1 P^{-1} P−1 也是正定对称的。

那么,怎么证明 P − 1 P^{-1} P−1 也是正定对称的呢?

首先,因为 P P P 是对称的,所以 P − 1 P^{-1} P−1 也是对称的。下面我们去证明 P − 1 P^{-1} P−1 是正定的,即对于 ∀ x ∈ R n \forall x \in \mathbb{R}^n ∀x∈Rn,我们须要证明 x T P − 1 x ≥ 0 x^T P^{-1} x \geq 0 xTP−1x≥0。因为 P P P 是可逆的,所以对于 x x x,我们能找到一个向量 y ∈ R n y \in \mathbb{R}^n y∈Rn,使得 x = P y x = P y x=Py。于是, x T P − 1 x = y T P T P − 1 P y = y T P y ≥ 0 \displaystyle x^T P^{-1} x = y^T P^T P^{-1} P y = y^T P y \geq 0 xTP−1x=yTPTP−1Py=yTPy≥0。从而 P − 1 P^{-1} P−1 也是正定的。

证明了 P − 1 P^{-1} P−1 是正定的,我们可以把 P − 1 P^{-1} P−1 写成 P − 1 = U Λ U T P^{-1} =U \Lambda U^T P−1=UΛUT,其中 U U U 是正交化(orthogonal)矩阵,即 U T U = I U^T U = I UTU=I。 Λ \Lambda Λ 是一个对角矩阵,且对角线的元素均大于 0。 从而我们可以定义 ( P − 1 ) 1 / 2 = U Λ 1 / 2 U T (P^{-1})^{1/2} = U \Lambda^{1/2} U^T (P−1)1/2=UΛ1/2UT。

现在我们来看 ( y − x c ) T P − 1 ( x − x c ) (y - x_c)^T P^{-1} (x - x_c) (y−xc​)TP−1(x−xc​),
( y − x c ) T P − 1 ( x − x c ) = ( y − x c ) T ( P − 1 ) 1 / 2 ( P − 1 ) 1 / 2 ( x − x c ) (y - x_c)^T P^{-1} (x - x_c) =(y - x_c)^T (P^{-1})^{1/2} (P^{-1})^{1/2} (x - x_c) (y−xc​)TP−1(x−xc​)=(y−xc​)T(P−1)1/2(P−1)1/2(x−xc​)。

根据 Cauch-Schwartz 不等式, ∣ ∣ x y ∣ ∣ 2 ≤ ∣ ∣ x ∣ ∣ 2 ∣ ∣ y ∣ ∣ 2 \vert \vert xy \vert \vert^2 \leq \vert \vert x \vert \vert^2 \vert \vert y \vert \vert^2 ∣∣xy∣∣2≤∣∣x∣∣2∣∣y∣∣2

我们有, ∣ ∣ [ ( y − x c ) T ( P − 1 ) 1 / 2 ] [ ( P − 1 ) 1 / 2 ( x − x c ) ] ∣ ∣ 2 ≤ ∣ ∣ ( P − 1 ) 1 / 2 ( y − x c ) ∣ ∣ 2 ⋅ ∣ ∣ ( P − 1 ) 1 / 2 ( x − x c ) ∣ ∣ 2 ≤ 1 ⋅ 1 = 1 \bigg| \bigg| \left[ (y - x_c)^T (P^{-1})^{1/2} \right] \left[ (P^{-1})^{1/2} (x - x_c) \right] \bigg| \bigg|^2 \\ \leq || (P^{-1})^{1/2} (y - x_c)||^2 \cdot || (P^{-1})^{1/2} (x - x_c) ||^2 \\ \leq 1 \cdot 1 = 1 ∣∣∣∣​∣∣∣∣​[(y−xc​)T(P−1)1/2][(P−1)1/2(x−xc​)]∣∣∣∣​∣∣∣∣​2≤∣∣(P−1)1/2(y−xc​)∣∣2⋅∣∣(P−1)1/2(x−xc​)∣∣2≤1⋅1=1

其中最后一个不等式来自于 x , y ∈ E x, y \in \mathscr{E} x,y∈E,即
( x − x c ) T P − 1 ( x − x c ) ≤ 1 , ( y − x c ) T P − 1 ( y − x c ) ≤ 1 (x - x_c)^T P^{-1} (x - x_c) \leq 1, \\ (y - x_c)^T P^{-1} (y - x_c) \leq 1 (x−xc​)TP−1(x−xc​)≤1,(y−xc​)TP−1(y−xc​)≤1.

这样我们就证明了对任意 0 ≤ θ ≤ 1 0 \leq \theta \leq 1 0≤θ≤1, θ x + ( 1 − θ ) y \theta x + (1 - \theta) y θx+(1−θ)y 也属于集合 E \mathscr{E} E。

于是,我们就从数学上证明了椭圆集合是一个凸集合。

从 norm 的角度去看 ellipsoid

下面,我们来看如何从 norm 的角度去看椭圆。

如果 || ⋅ \cdot ⋅ || 是 R n \mathbb{R}^n Rn 上的一个 norm,那么对应于 || ⋅ \cdot ⋅ || 的 norm ball 定义为集合 { x ∣ ∣ ∣ x − x c ∣ ∣ < = r } \{x \vert \hspace{2mm} ||x - x_c|| <= r \} {x∣∣∣x−xc​∣∣<=r}。其中 x c x_c xc​ 称为 norm ball 的中心, r r r 称为 norm ball 的半径。

我们可以证明 norm ball 是一个凸集合。

对于不熟悉 norm 定义的读者,我们先来快速回顾一下 norm 的定义。
如果 ∣ ∣ ⋅ ∣ ∣ || \cdot || ∣∣⋅∣∣ 满足下面三个性质,那么 ∣ ∣ ⋅ ∣ ∣ || \cdot || ∣∣⋅∣∣ 就称为 norm。

  1. 对于任意的 x ∈ R n x \in \mathbb{R^n} x∈Rn, ∣ ∣ x ∣ ∣ ≥ 0 || x || \geq 0 ∣∣x∣∣≥0, ∣ ∣ x ∣ ∣ = 0 ||x || = 0 ∣∣x∣∣=0 当且仅当 x = 0 x = 0 x=0.
  2. ∣ ∣ c x ∣ ∣ = c ⋅ ∣ ∣ x ∣ ∣ || c x || = c \cdot ||x|| ∣∣cx∣∣=c⋅∣∣x∣∣,对于任意 c ∈ R , c > 0 c \in R, c > 0 c∈R,c>0.
  3. 三角不等式,即 ∣ ∣ x + y ∣ ∣ ≤ ∣ ∣ x ∣ ∣ + ∣ ∣ y ∣ ∣ || x + y || \leq ||x|| + || y || ∣∣x+y∣∣≤∣∣x∣∣+∣∣y∣∣.

于是,对于 norm ball, 即集合 C = { x ∣ ∣ ∣ x − x c ∣ ∣ < = r } C = \{x \vert \hspace{2mm} ||x - x_c|| <= r \} C={x∣∣∣x−xc​∣∣<=r},如果有 x , y ∈ C x, \, y \in C x,y∈C,以及 0 ≤ θ ≤ 1 0 \leq \theta \leq 1 0≤θ≤1,那么
∣ ∣ θ x + ( 1 − θ ) y − x c ∣ ∣ = ∣ ∣ θ ( x − x c ) + ( 1 − θ ) ( y − x c ) ∣ ∣ ≤ ∣ ∣ θ ( x − x c ) ∣ ∣ + ∣ ∣ ( 1 − θ ) ( y − x c ) ∣ ∣ ≤ θ r + ( 1 − θ ) r = r \begin{aligned}|| \theta x + (1 - \theta) y - x_c || &= || \theta(x - x_c) + \\ & (1 - \theta) (y - x_c) || \\ & \leq || \theta (x - x_c) || + ||(1 - \theta) (y - x_c)|| \\ & \leq \theta r + (1 - \theta)r = r \end{aligned} ∣∣θx+(1−θ)y−xc​∣∣​=∣∣θ(x−xc​)+(1−θ)(y−xc​)∣∣≤∣∣θ(x−xc​)∣∣+∣∣(1−θ)(y−xc​)∣∣≤θr+(1−θ)r=r​

从而 θ x + ( 1 − θ ) y \theta x + (1 - \theta) y θx+(1−θ)y 也属于集合 C C C。即 C C C 是一个 convex set。

为了从 norm 的角度去看椭圆这个集合,我们先来看 Mahalanobis norm。

Mahalanobis norm

我们定义 Mahalanobis norm 为 ∣ ∣ x ∣ ∣ p = x T P x ||x||_p = \sqrt{x^T P x} ∣∣x∣∣p​=xTPx ​。其中 x ∈ R n x \in \mathbb{R}^n x∈Rn, P P P 是对称的,且 P ≻ 0 P \succ 0 P≻0,即 P P P 是对称正定的。

我们先证明 Mahalanobis norm 是一个 norm。

  1. 如果 ∣ ∣ x ∣ ∣ p = 0 ||x||_p = 0 ∣∣x∣∣p​=0,那么 x T P x = 0 x^T P x = 0 xTPx=0。而根据 P ≻ 0 P \succ 0 P≻0,当 x T P x = 0 x^T P x = 0 xTPx=0 时,我们有 x = 0 x = 0 x=0.
  2. 对于任意 c ∈ R , c > 0 c \in R, c > 0 c∈R,c>0, ∣ ∣ c x ∣ ∣ p = c x T P x = c ∣ ∣ x ∣ ∣ p ||c x||_p =c \sqrt{x^T P x} = c ||x||_p ∣∣cx∣∣p​=cxTPx ​=c∣∣x∣∣p​。
  3. 三角不等式。根据 Mahalanobis norm 的定义,我们有 ∣ ∣ x + y ∣ ∣ p 2 = ( x + y ) T P ( x + y ) = x T P x + y T P y + x T P y + y T P x = x T P x + y T P y + 2 x T P y || x + y||_p^2 = (x + y)^T P (x + y) =x^TPx + y^TPy + x^TPy + y^TPx = x^TPx + y^TPy +2x^TPy ∣∣x+y∣∣p2​=(x+y)TP(x+y)=xTPx+yTPy+xTPy+yTPx=xTPx+yTPy+2xTPy. 因为 P P P 是对称且正定的,所以我们可以将 P P P 写成 P = U Λ U T P =U\Lambda U^T P=UΛUT. 其中 U U U 是正交化矩阵,即 U T U = I U^TU = I UTU=I, Λ \Lambda Λ 是对角矩阵,对角线上的元素都是正的。类似于之前的讨论,我们可以定义 P 1 / 2 = U Λ 1 / 2 U T P^{1/2} = U \Lambda^{1/2} U^T P1/2=UΛ1/2UT. 从而,
    ∣ ∣ x + y ∣ ∣ p 2 = ∣ ∣ x ∣ ∣ p 2 + ∣ ∣ y ∣ ∣ p 2 + 2 x T P 1 / 2 P 1 / 2 y ≤ ∣ ∣ x ∣ ∣ p 2 + ∣ ∣ y ∣ ∣ p 2 + 2 ∣ x T P 1 / 2 P 1 / 2 y ∣ ≤ ∣ ∣ x ∣ ∣ p 2 + ∣ ∣ y ∣ ∣ p 2 + 2 ∣ ∣ P 1 / 2 x ∣ ∣ 2 ⋅ ∣ ∣ P 1 / 2 y ∣ ∣ 2 = ∣ ∣ x ∣ ∣ p 2 + ∣ ∣ y ∣ ∣ p 2 + 2 ∣ ∣ x ∣ ∣ p ⋅ ∣ ∣ y ∣ ∣ p \begin{aligned}||x + y||_p^2 &= ||x||_p^2 + ||y||_p^2 + 2 x^T P^{1/2} P^{1/2}y \\ & \leq ||x||_p^2 + ||y||_p^2 + 2 | x^T P^{1/2} P^{1/2}y | \\ & \leq ||x||_p^2 + ||y||_p^2 + 2 ||P^{1/2}x||_{2} \cdot ||P^{1/2}y||_{2} \\ &= ||x||_p^2 + ||y||_p^2 + 2 ||x||_p \cdot ||y||_p \end{aligned} ∣∣x+y∣∣p2​​=∣∣x∣∣p2​+∣∣y∣∣p2​+2xTP1/2P1/2y≤∣∣x∣∣p2​+∣∣y∣∣p2​+2∣xTP1/2P1/2y∣≤∣∣x∣∣p2​+∣∣y∣∣p2​+2∣∣P1/2x∣∣2​⋅∣∣P1/2y∣∣2​=∣∣x∣∣p2​+∣∣y∣∣p2​+2∣∣x∣∣p​⋅∣∣y∣∣p​​
    所以三角不等式成立。
    这里倒数第二步的不等式用到了 Cauch-Schwartz 定理。

我们证明了 Mahalanobis norm 确实是一个 norm。那么它与椭圆有什么关系呢?

椭圆是一个 norm ball

实际上,椭圆就是在 Mahalanobis norm 下的一个 norm ball。因为在 Mahalanobis norm 下,一个 norm ball 就定义为:

C = { x ∣ ∣ ∣ x − x c ∣ ∣ p ≤ r } C = \{x \vert \hspace{2mm} ||x - x_c||_p \leq r \} C={x∣∣∣x−xc​∣∣p​≤r} ,

即 C = { x ∣ ( x − x c ) T P ( x − x c ) ≤ r } C = \{x \vert \hspace{2mm} \sqrt{(x - x_c)^T P (x - x_c) } \leq r \} C={x∣(x−xc​)TP(x−xc​) ​≤r}。

取 r = 1 r = 1 r=1,我们就得到了椭圆的定义。所以,椭圆就是在 Mahalanobis norm 下的一个 norm ball。而我们之前证明了 Mahalanobis norm 是一个 norm,并且任意 norm 上的 norm ball 都是一个凸集合。自然得,椭圆也是凸集合。

从仿射的角度看椭圆

参考文献

Convex optimization, Chapter 1, Stephen Boyd, Lieven Vandenberghe, Cambridge University Press, (2004)

椭圆是一个凸集的证明相关推荐

  1. 人工智能需要一个可被证明的理论作为基础 | 哈佛丘成桐

    来源:雷锋网 本文长度为5856字,建议阅读8分钟 本文为你整理中国计算机大会中,哈佛教授丘成桐关于"现代几何在计算机科学中的应用"的演讲报告. 2017年10月26日上午,第十四 ...

  2. 20200915 椭圆范数的三角不等式证明:sqrt(x^T*Q*x)

    椭圆范数的三角不等式证明 实际上,这里没有用到的另一条关于正定矩阵的性质: 正定矩阵一定是对称的,而实对称矩阵一定存在正交矩阵PPP,满足PTQP=P−1QP=IP^TQP=P^{-1}QP=IPTQ ...

  3. 这篇长达165页的论文,用一个里程碑式的证明同时解决了量子物理学和理论数学的难题...

    来源:机器之心 计算机科学.数学.物理学,这三个学科各自的一些重大难题在近日发布的一篇标题简洁的论文<MIP*=RE>中同时得到了解答.在该论文中,五位计算机科学家为可通过计算方式验证的知 ...

  4. 一个漂亮的证明与作图:高斯的正十七边形

    一天晚上,19岁正读博的高斯的导师由于疏忽将两千多年未解决的一个问题--尺规做正十七边形留给了高斯,高斯优哉游哉得咬着笔头写着作业,然后表情严肃起来,妈的这题有点BT啊!想啊想,通宵一晚,伴着拂晓的晨 ...

  5. 我给出了一个 四色定理 的 证明

    四色定理, 实际上是 看 平面图形 的 "共聚" 行为 最多可以 发生 在 几个 图形 上  . 我们先来看看 什么 是 地图 : 地图 就是 平面 上  n 个 图形  . 图形 ...

  6. 有关凸集的证明例题_泛函分析题1.5凸集与不动点答案

    20070504 1 泛函分析题 1_5 凸集与不动点 p52 1.5.1 设 X 是 B * 空间, E 是以  为内点的真凸子集, P 是由 E 产生的 Minkowski 泛函,求证: (1) ...

  7. 学习笔记--关于一个公式的证明

    关于一个公式 (本文的大多数推导过程是作者自己 YY 出来的,不能保证严谨性)   就是在写关于莫比乌斯反演的东西的时候,我就想着自己证明一遍莫比乌斯函数的性质(当时还没学,在边学边写),然后我就开始 ...

  8. 有关凸集的证明例题_第1章引言题解1. 用定义验证下列各集合是凸集: (1) S={(X1 ......

    ) f(x1,x2)=x21-4x1x2+x22+x1+x2: (3) f(x1,x2)=(x1-x2)2+4x1x2+ex1+x2: (4) f(x1,x2)=x1e-(x1+x2): (5) f( ...

  9. 如果从椭圆的一个焦点发出光线,再经过椭圆的反射,会发生什么?

    一键关注

最新文章

  1. 文件上传的实现(C#)
  2. 计算机程序的思维逻辑 (38) - 剖析ArrayList
  3. CentOS配置网关服务器
  4. dommel mysql_.Net Core AA.FrameWork应用框架介绍
  5. 拒绝DNN过拟合,谷歌准确预测训练集与测试集泛化差异,还开源了数据集 | ICLR 2019...
  6. POJ 2709 Painter
  7. Nginx的官方简介
  8. Java单例模式深入详解
  9. 【leetcode】523. Continuous Subarray Sum
  10. 玩转木浪云数据管理免费版使用篇之内容搜索与颗粒度恢复
  11. Google的十个核心技术,互联网营销
  12. matlab 拟合优度检验,χ~2拟合优度检验在教学中的应用及Matlab实现
  13. Windows域服务权限提升漏洞(CVE-2021-42287, CVE-2021-42278)
  14. 将会彻底破坏你的树莓派的六件事(官网翻译)
  15. mysql 表分区修复,硬盘分区表损坏后的数据恢复方法
  16. sqli-labs(32-37)
  17. 漫反射贴图与镜面光贴图
  18. Quoted-printable
  19. Alkyne-PEG-Amine,Alkyne-PEG-NH2 炔基PEG氨基
  20. (批处理)使用bat如何取出文件夹里子文件夹下的文件?

热门文章

  1. Kettle之Carte最佳实践
  2. 囧人又做了哪些囧事呢?
  3. Deep learning for minimum mean-square error approaches to speech enhancement
  4. DataFrame上下或左右合并 pd.concat
  5. LiveData详细分析
  6. 又赚了!分享几个我常去的私活接单平台
  7. 09.5. 机器翻译与数据集
  8. 解决word2019中求和符号上下标被强制挪到右边的问题
  9. 华为HCIP RS题库221 451-460题
  10. 我的linux系统怎么输入pv,如何在Linux系统中使用pv命令