文章目录

  • 引言
  • 泛函
    • 泛函定义
  • 泛函的变分
  • 变分不等式
    • 变分不等式定义
    • 变分不等式几何性解释
  • 参考文献

引言

\quad\quad最近接触了泛函的变分的概念,回头再想变分不等式,怎么也想不明白变分不等式是如何 “变分” 的,所以重新一起看了下两者,整理在此,以便理解清晰。
\quad\quad 首先来看泛函的变分。为了解释清晰,先根据自我理解介绍下泛函的概念。

泛函

泛函定义

对于某一类函数集合{x(t)}\{x(t)\}{x(t)} 中的每一个函数 x(t)x(t)x(t), 在映射关系 JJJ 下均有一个确定的数与之对应,则称 JJJ 为依赖于函数 x(t)x(t)x(t) 的泛函,记作J=J[x(.)]=J[x(t)]J=J[x(.)]=J[x(t)]J=J[x(.)]=J[x(t)]
注:泛函与函数的区别

泛函即为以函数为自变量的一种映射到实数域的映射关系。而函数则是以某一实数为自变量映射到实数域的映射关系。这里的J[x(t)]J[x(t)]J[x(t)]可理解为整条曲线 x(t)x(t)x(t) 在映射关系 JJJ 下对应一个实数值。下面来解释一下泛函的自变量,如下图:

假设从[0,1]位置我们丢掷一个物体,该物体分别沿 f(x)f(x)f(x), h(x)h(x)h(x), g(x)g(x)g(x) 三条轨道下落,同样都可降落至 [1,0]。那么我们可以将这个下落的过程称为一个泛函,三条下落的轨道曲线称为这个泛函的自变量,即泛函定义中的函数集合为 {f(x),h(x),g(x)}\{f(x),h(x),g(x)\}{f(x),h(x),g(x)},这个物体的高度位置即为映射关系 JJJ,确定的数为高度0。

泛函的变分

类似于函数中的自变量的含义,在泛函中定义域函数集合中的函数也有其自身的名称,即为宗量

  • 宗量:若函数 x(t)x(t)x(t) 是映射关系 JJJ 的自变量函数,则称 x(t)x(t)x(t) 为泛函 J[x(t)]J[x(t)]J[x(t)] 的宗量函数。如上图的 f(x)f(x)f(x), h(x)h(x)h(x), g(x)g(x)g(x) 都成为宗量函数。

同样类似于函数中两个自变量的差对应于泛函中为宗量的变分

  • 宗量的变分:宗量的变分是指在同一函数类中的两个宗量函数间的差,即:δx(t)=x(t)−x∗(t).\delta x(t)=x(t)-x^*(t).δx(t)=x(t)−x∗(t).

类似于函数取值的差在泛函关系中用泛函增量来表示,比如上图中物体的高度在某一时刻使用不同轨道的差值。

  • 泛函的增量()
    由自变量函数 x(t)x(t)x(t) 的变分 δx(t)\delta x(t)δx(t) 引起泛函 J[x(t)]J[x(t)]J[x(t)] 的增量 ΔJ=J[x(t)]−J[x∗(t)]=J[x∗(t)+δx(t)]−J[x∗(t)]\Delta J=J[ x(t)]-J[x^*(t)]=J[x^*(t)+\delta x(t)]-J[x^*(t)]ΔJ=J[x(t)]−J[x∗(t)]=J[x∗(t)+δx(t)]−J[x∗(t)] 为泛函 J[x(t)]J[x(t)]J[x(t)] 的增量。
    即假设这里的x(t)x(t)x(t) 为上图中的轨道 f(x)f(x)f(x), 这里的增量即可解释为使用轨道 f(x)f(x)f(x) 相较于使用轨道 h(x)h(x)h(x), g(x)g(x)g(x) 的物体的高度的差值。

继而,类似于函数导数的概念,在泛函中有泛函的变分的概念,即:

  • 泛函的变分
    当宗量函数 x(t)x(t)x(t) 有变分时,泛函 J[x(t)]J[x(t)]J[x(t)] 的增量 ΔJ[x(t)]\Delta J[x(t)]ΔJ[x(t)] 可表示为ΔJ=J[x∗(t)+δx(t)]−J[x(t)]=dJdx∣x∗δx+12d2Jdx2∣x∗(δx)2+R,\Delta J=J[x^*(t)+\delta x(t)]-J[x(t)]=\frac{dJ}{dx}|_{x^*}\delta x+\frac{1}{2}\frac{d^2J}{dx^2}|_{x^*}(\delta x)^2+R,ΔJ=J[x∗(t)+δx(t)]−J[x(t)]=dxdJ​∣x∗​δx+21​dx2d2J​∣x∗​(δx)2+R, 其中ΔJ\Delta JΔJ 的线性部分称为泛函的变分,记作 δJ\delta JδJ,即 δJ=dJdx∣x∗δx,\delta J=\frac{dJ}{dx}|_{x^*}\delta x,δJ=dxdJ​∣x∗​δx,换句话说, 泛函的变分是泛函增量的线性主部。

Lemma 1: 泛函的变分 δJ=∂∂αJ[x(t)+αδx(t)]∣α=0\delta J=\frac{\partial}{\partial \alpha}J[x(t)+\alpha \delta x(t)]|_{\alpha=0}δJ=∂α∂​J[x(t)+αδx(t)]∣α=0​

Example 1: 计算泛函 J=∫01x2(t)dtJ=\displaystyle \int_0^1x^2(t)dtJ=∫01​x2(t)dt 的变分。
δJ=∂∂αJ[x(t)+αδx(t)]∣α=0=∂∂α∫01[x(t)+αδx(t)]2dt∣α=0=∫012[x(t)+αδx(t)]δx(t)dt∣α=0=∫012x(t)δx(t)dt\begin{aligned} \delta J&=\frac{\partial}{\partial \alpha}J[x(t)+\alpha\delta x(t)]|_{\alpha=0}\\ &=\frac{\partial}{\partial \alpha}\displaystyle\int_0^1[x(t)+\alpha\delta x(t)]^2dt|_{\alpha=0}\\ &=\displaystyle\int_0^12[x(t)+\alpha \delta x(t)]\delta x(t)dt|_{\alpha=0}\\ &=\displaystyle\int_0^12x(t)\delta x(t)dt \end{aligned}δJ​=∂α∂​J[x(t)+αδx(t)]∣α=0​=∂α∂​∫01​[x(t)+αδx(t)]2dt∣α=0​=∫01​2[x(t)+αδx(t)]δx(t)dt∣α=0​=∫01​2x(t)δx(t)dt​

变分不等式

首先来看一下什么叫做变分不等式。

变分不等式定义

变分不等式(variational inequality) VI(F,X)VI(F,X)VI(F,X)的正式数学定义为:

任给定义在巴纳赫空间(内积空间)Ω\OmegaΩ 的一个子集 XXX 上的泛函 F:X→Ω∗F: X\to \Omega^*F:X→Ω∗, 其中 Ω∗\Omega^*Ω∗ 是 Ω\OmegaΩ 的对偶空间(对偶空间的解释参阅参考文献2)则VI(F,X)VI(F,X)VI(F,X) 等价于寻找一个 x∈Xx\in Xx∈X,使得
⟨F(x),y−x⟩≥0\langle F(x),y-x\rangle\geq0⟨F(x),y−x⟩≥0对于任意的 y∈Xy\in Xy∈X成立。
在最优化方面的定义:
给定 RnR^nRn 的一个子集(闭凸集) KKK以及映射 F:K→RnF: K\to R^nF:K→Rn,变分不等式问题 VI(K,F)VI(K,F)VI(K,F) 即为寻求一个x∗∈Kx^*\in Kx∗∈K 使得
(x−x∗)TF(x∗)≥0(x-x^*)^TF(x^*)\geq 0(x−x∗)TF(x∗)≥0
对任意的 x∈Kx\in Kx∈K 成立。

变分不等式几何性解释

若可行点 x∗x^*x∗ 为变分不等式 问题 VI(F,X)VI(F,X)VI(F,X) 的一个解,则映射 FFF 在 x∗x^*x∗ 点处与所有可行方向 x−x∗x-x^*x−x∗, ∀x∈K\forall x\in K∀x∈K 之间的夹角为锐角(acute angle)

问题:还是没搞懂变分不等式的变分与泛函的变分之间的关系。变分不等式variational inequality中variational是否可解释为可变的,即可变的不等式。
自我理解:求泛函的极大值和极小值问题称为变分问题,求泛函极值的方法称为变分法。当不等式的等号成立的时候取得极值,因变分不等式与泛函的极值有关故而称为变分不等式。该命名是从变分法的定义来看的。

参考文献

  1. 【优化】浅谈变分不等式与凸优化
  2. 怎么形象地理解对偶空间
  3. 变分不等式讲义

泛函,变分与变分不等式相关推荐

  1. 数学狂想曲(十一)——高阶统计, 最速降线, 泛函 变分

    高阶统计 Cumulants(续) 在介绍Cumulants之前,我们首先看一下Moment-generating function: MX(t):=E⁡[etX],t∈RM_X(t) := \ope ...

  2. 最优控制问题笔记二(泛函与变分)

    现代控制理论最优控制问题笔记二 泛函与泛函的变分 泛函的定义 对于某一类函数集合 x ( t ) {x(t)} x(t)中的每一个函数 x ( t ) x(t) x(t),都有一个确定的 J J J与 ...

  3. 结合泛函极值_泛函极值及变分法教程.doc

    PAGE PAGE 53 第二章 泛函极值及变分法(补充内容)2.1 变分的基本概念2.1.1 泛函和变分泛函是一种广义的函数,是指对于某一类函数{y(x)}中的每一个函数y(x),变量J有一值与之对 ...

  4. 结合泛函极值_泛函极值及变分法讲义.doc

    第二章 泛函极值及变分法(补充内容) 2.1 变分的基本概念 2.1.1 泛函和变分 泛函是一种广义的函数,是指对于某一类函数{y(x)}中的每一个函数y(x),变量J有一值与之对应,或者说数J对应于 ...

  5. 变分(Calculus of variations)的概念及运算规则(一)

    文章目录 1. 回顾:微分的定义 2. 泛函概念 3. 变分概念 4. 变分的运算法则 4.1 变分的基本运算法则 4.2 变分的运算法则详述 4.2.1 定义 4.2.2 特性 4.2.3 确定泛函 ...

  6. 变分推断 python_变分推断(Variational Inference)

    变分 对于普通的函数f(x),我们可以认为f是一个关于x的一个实数算子,其作用是将实数x映射到实数f(x).那么类比这种模式,假设存在函数算子F,它是关于f(x)的函数算子,可以将f(x)映射成实数F ...

  7. 结合泛函极值_泛函极值与变分法

    这篇文章是为了回答一位知友的提问而作的向未了解过变分法这个概念的读者介绍它的文章,因此本文只涉及一些变分法的入门知识.在从极值条件导出欧拉方程时只涉及泛函变分的Lagrange定义,这样一来就不必引入 ...

  8. 结合泛函极值_泛函的极值

    相关文献 0 引 言在许多工程中,特别在可靠性最优化问题上,被广为实践应用的是被抽象为表示为分式的线性泛函数G(f)=M(f)N(f)(1)式中M.N分别表示在某一分布函数f(x)(x∈R(n),n& ...

  9. 模拟上帝之手的对抗博弈——GAN背后的数学原理

    模拟上帝之手的对抗博弈--GAN背后的数学原理 深度学习 人工智能 机器学习 神经网络 神经网络与机器学习-英文版 阅读1984  作者:李乐 CSDN专栏作家 简介 深度学习的潜在优势就在于可以利用 ...

最新文章

  1. public class UserServiceImpl extends ServiceImpl UserMapper, User implements UserService
  2. Keras: 多输入及混合数据输入的神经网络模型
  3. 史迪仔的原型_星际宝贝三个版本对比,莉罗抛弃史迪仔,童年真的回不去了
  4. 你的公司,远程办公多久了?
  5. LeetCode-----用两个栈实现一个队列
  6. python 学堂在线_最新网课答案2020学堂在线Python 交互式程序设计导论
  7. 比尔·盖茨退出微软董事会,回顾盖茨与微软的传奇故事
  8. 用c语言绘制小猫图案,【科研猫·R】R语言从入门到精通:Day8
  9. 【EXLIBRIS】#小词旮旯# 001 Lock
  10. esp01s改造老旧吸尘器连入天猫精灵语音控制(blinker + 阿里云)
  11. 漫画:脑筋急转弯题目(尼姆问题求解)
  12. Unity Monetization 3.0 部分接入文档内容
  13. 架构设计---高可用的处理
  14. 27个iOS开源库,让你的开发坐上火箭吧
  15. 解决电脑连上wifi无法上网问题
  16. 威纶通触摸屏配方功能的使用方法示例
  17. 目标检测算法——人脸识别数据集汇总(附下载链接)
  18. 2022G3锅炉水处理考试题库及答案
  19. [游戏]求生之路新地图安装说明
  20. STM32 引脚电平拉不低

热门文章

  1. Towards Adversarial Attack on Vision-Language Pre-training Models
  2. Linux内核:一文搞懂外设I/O内存资源的静态映射方式
  3. 苹果开发者公司账号的申请步骤
  4. [编程神域 C语言浮游塔 第①期] Hello C language world
  5. 苹果股价盘后涨超5% 市值一度突破万亿
  6. 2020第十一届蓝桥杯7月份省赛真题(JavaB组题解)
  7. aar打包依赖 android_打包依赖.aar文件以及坑总结
  8. JS与jQuery获取任意事件的子元素下标(获取当前类数组的某一子元素下标)
  9. 帆软数据分析:BI物流可视化
  10. 摩托车新手驾驶教程[1]