缘起

1995年秋季,第二作者刚刚来到哈佛大学开始攻读计算机科学领域的博士学位,并在数学系学习丘成桐先生的微分拓扑课程,同时在麻省理工学院人工智能实验室学习Berthold Horn教授的机器人视觉课程. Horn教授提倡从物理的角度来理解视觉机理,用偏微分方程来解决工程问题.Horn教授讲解了他的经典工作“Shape from Shading”,将从二维图片重建三维几何的问题归结为求解双曲型偏微分方程. Horn教授也讲解了“Extended Gauss Image”的想法,目的是用Gauss曲率来重建凸曲面,这等价于微分几何中的Minkowski问题,归结为求解Monge-Ampère方程.但是,那时计算机视觉领域并没有严格高效的计算方法.当时,由于无法理解艰深的非线性偏微分方程理论,为了求解Minkowski问题,第二作者冒昧地向丘先生求教.丘先生非常平易近人,看到有人对Minkowski问题有兴趣,他非常兴奋,并且亲自复印了他与郑绍远教授的经典论文“On theRegularity of the Solution of then-Dimensional Minkowski Problem”.在文章中,丘先生与郑教授证明了任意维Minkowski问题解的存在性、唯一性和正则性.在丘先生的指导下,第二作者系统地学习了Alexandrov和Pogorelov的经典文章和著作.在随后的多次讨论中,丘先生传授了求解Monge-Ampère方程的算法. Monge-Ampère方程具有强烈的非线性,而那个时代,通用计算机的算力非常有限,每次实验运行时间都会长达数天,因此算法设计与实验颇具挑战性。

时代要求二十多年后,人工智能再度兴起,大数据、深度学习技术在工程领域取得了巨大成功,但是这些算法背后的理论解释依然处于初始状态.为新一代人工智能技术奠定理论基础,成为时代发展的迫切要求.在丘先生的带领下,作者团队用现代拓扑几何理论为深度学习提出了一个理论框架.在计算机视觉领域,每个概念对应一类自然的图像数据;每个图像被视为高维图像空间中的一个点;同类图像构成图像空间中的一个稠密点云,而此点云分布在某个低维数据流形附近.由此,此类数据被表示为数据流形上的概率分布.从而,我们得到深度学习的两个核心任务:学习数据流形的结构,学习流形上的概率分布.深度学习算法本质上是在数据流形上以所有概率测度构成的空间中进行优化.而最优传输映射为第二个核心任务(即学习概率分布)提供了坚实的理论基础和强大的计算工具.

正是因为深度学习和大数据的兴起,最优传输理论进入了计算机科学的中心舞台.交叉学科开始涌现,近似计算方法层出不穷.在各类方法中,最为直观、最为精确的算法却是来自最优传输的Brenier理论,而这一理论恰恰与Minkowski、Alexandrov和Pogorelov的凸微分几何理论等价,最后归结为求解Monge-Ampère方程.这令作者百感交集,感慨万千,对于丘先生的高瞻远瞩更是无比钦佩.每个年轻学者的终极梦想都是希望在刚入门时导师能够给出一套深刻直观的方法,同时指明一个有长远发展前景的方向.为此,作者深感幸运,对丘先生更是无比感激!

简明历史

2010年前后,丘先生与作者团队开始了最优传输几何化方向的研究,很快给出了Alexandrov定理的构造性证明,发展了几何变分算法,并且很快应用于可解释深度学习的研究.同时,我们在海内外的一些大学(包括纽约州立大学石溪分校、清华大学丘成桐数学科学中心、大连理工大学、首都师范大学)开设最优传输理论的课程,并在数十个国际会议、大学讨论班中做了相关演讲. 2020年,由于全球疫情的影响,作者在线上讲授了“最优传输理论和算法”的课程.在高峰期,一节课有三万多人同时听讲,同学们的巨大热情令作者非常感动.同学们来自社会的各行各业,既有高等院校计算机科学、数学、电子自动化等理工专业的本科生与研究生,又有自动驾驶、虚拟现实、动漫动画、医学影像、电子金融、人工智能等领域高科技公司的技术科研人员.这些都显示了最优传输理论、可解释人工智能技术的广阔应用前景.内容简介我们课程的重点在于了解理论体系,建立几何直觉,开发实用算法,应用于工程实践.线上大篇幅讲解最优传输理论具有很大的挑战性,该理论的体系宏大,内容艰深,对数理基础要求较高,初学者难以掌握.针对绝大多数同学都是来自信息技术产业,具有工程科学背景,作者为课程安排了多次编程作业,将复杂算法分解成多个步骤,循序渐进,由浅入深,这有助于同学们将抽象的理论和具体的算法实现联系起来,通过动手实践来加深并检验对于抽象理论的理解.在课程结束后,课程的关键算法在网上开源,以帮助同学们进一步理解,并且在实践中找到具体应用.

课程特色在于从多种观点讲解最优传输理论,并且核心理论与计算方法并重.最优传输理论大致有三种主要观点,同时有相应的计算方法:对偶观点、几何观点和流体观点.这些观点相辅相成,浑然一体.我们首先介绍了Monge-Kantorovich理论, Monge最早提出了最优传输映射问题,Kantorovich将其推广为最优传输方案,并且发展出线性规划方法,提出了等价的对偶问题. Kantorovich对偶问题成为后来理论发展的起点.在深度学习领域中,常用的Sinkhorn算法本质上是线性规划加上熵正则项.如果传输代价为欧氏距离的平方, Brenier证明了最优传输映射是Brenier势能函数的梯度映射,而Brenier势能函数满足经典的Monge-Ampère方程,Monge-Ampère方程又天然联系着Minkowski问题和Alexandrov问题.于是,我们进入了最优传输理论的几何观点,即Minkowski、Alexandrov和Pogorelov的经典凸几何理论,丘先生在高维的推广以及汪徐家教授在球面几何上的推广.从计算角度而言,我们应用顾险峰–罗锋–孙剑–丘成桐定理,与经典计算几何的power图理论相联系,详细介绍了几何变分算法,并且从欧氏空间推广到球面几何,从低维推广到高维.第三个阶段,我们介绍了流体力学观点下的最优传输理论,着重介绍Benamou-Brenier理论,将最优传输映射和极小化动能流场相联系,用流体力学方程来描述最优传输问题.这一观点自然将Riemann几何引入最优传输理论,为流形上以概率测度构成的无穷维抽象空间引入了测地线、Riemann度量和协变微分.从计算角度而言,我们着重介绍了Benamou-Brenier算法和Tennanbaum算法.更进一步,我们简要介绍了Monge-Ampère方程理论,用经典方法证明了解的存在性、唯一性和正则性,然后介绍了Monge-Ampère方程的数值方法和最优传输映射的计算方法.最后,我们介绍了最优传输映射在人工智能领域的应用,用最优传输理论的Riemann几何观点,重新诠释了深度学习中的最大熵原则,用Monge-Ampère方程的正则性理论来解释最优传输中的模式坍塌问题,等等.

鸣谢

Monge于1781年提出最优传输问题,历经二百余年的发展,目前这一理论已经广袤深邃,博大精深.为了教学,我们收集了大量的资料,主要的经典教材包括Cédric Villani、Alessio Figalli、A. D. Alexandrov、Fillippo Santambrogio的著作,主要的论文包括丘成桐、汪徐家、Brenier及很多数学家和计算机科学家的工作.我们也将自己团队近期的理论工作、计算方法,以及在人工智能、计算机视觉、图形学等领域的工作融汇其中.在本书编写过程中,我们得到了很多师长、朋友和学生们的帮助,作者表示衷心的感谢!特别是丘成桐、汪徐家、方复全、徐宗本、高小山、罗钟铉等教授,为这门课程提供了大力支持;罗锋、孙剑、王雅琳、苏科华、崔丽、刘佳堃、陈世炳等教授,与我们团队共同建立了最优传输的几何优化理论,提出了严密精确的算法; Arie Kaufman、段晔、曾薇、章敏、马明、郑晓朋等教授, Joe Marino、Saad Nadeem、苏正宇、陈伟、温成峰、齐鑫、李新元、安东生、郭洋、涂颜帅、王发强等博士,将算法加以实现,并且广泛应用于人工智能、计算机视觉、图形学与医学影像各领域,作者对所有这些合作者以及帮助过我们的学者朋友,表示由衷的谢意!

期望

一门课程无法涵盖这门理论的方方面面,也无法达到理想的深度;同时因为最优传输计算方法的飞速发展,我们无法详细追踪新建立的算法.在本书编写过程中,不可避免地存在错误和遗漏,希望广大读者指出,以帮助作者进一步改进!

展望未来,作者认为经典的最优传输映射正则性理论忽略了映射的奇异集合,而这正是深度学习中模式坍塌的关键所在,由此最优传输映射奇异集理论需要长足发展.同时,经典最优传输映射的计算方法,通常只关注于低维方法的精确度和收敛性分析,而高维的近似方法则过于粗略.发展高效而精密的高维最优传输映射的算法,是人工智能技术发展不可或缺的环节.作者希望更多的年轻人能够投入到这一古老而又年轻的领域,从理论到实践,进一步推动最优传输理论的发展,更加深刻地应用到工程和医疗领域,引领下一代人工智能技术发展的浪潮!

雷娜、顾险峰 2021年7月

微弱而不好意思的链接:微博

目录

第一部分最优传输的对偶理论

第一章Monge-Kantorovich 理论

1.1 凸函数的Alexandrov 理论

1.1.1 次微分

1.1.2 Legendre-Fenchel 变换

1.1.3 Alexandrov 定理

1.2 Monge 问题与Kantorovich 问题

1.2.1 空间、弱收敛和连续性

1.2.2 M(X) 和C0(X) 间的对偶

1.2.3 紧空间上连续代价函数的Kantorovich 问题

1.2.4 紧空间下半连续代价函数的Kantorovich 问题

1.2.5 Polish 空间下半连续代价函数Kantorovich 问题的解

第二章对偶理论

2.1 对偶问题

2.1.1 广义Lagrange 乘子法

2.1.2 连续函数空间的紧致性

2.1.3 c-变换

2.2 Kantorovich 问题和对偶问题的等价性

2.2.1 循环单调性

2.2.2 连续代价函数(KP) 与(DP) 的等价性

2.2.3 下半连续代价函数(KP) 与(DP) 的等价性

第三章Brenier 理论

3.1 Brenier 问题

3.1.1 严格凸的代价函数

3.1.2 欧氏距离平方代价函数

3.1.3 最优性条件

3.1.4 稳定性条件

3.2 Brenier 极分解

3.2.1 实矩阵的极分解

3.2.2 向量场的Hodge-Helmholtz 分解

3.2.3 Brenier 极分解

第二部分凸几何理论

第四章Minkowski-Alexandrov 凸几何理论

4.1 Brunn-Minkowski 不等式

4.2 等周不等式

4.3 Alexandrov 映射引理

4.4 Minkowski 问题I

4.5 Minkowski 问题II

4.6 Alexandrov 定理

第五章半离散最优传输的变分原理

5.1 变分法原则

5.2 Legendre-Fenchel 对偶

5.3 Alexandrov 定理证明的推广

5.4 Pogorelov 定理的证明

第三部分球面最优传输

第六章球面power 图理论

6.1 曲面微分几何基本概念

6.2 球面微分几何

6.3 球面power 图

第七章Minkowski I 问题

7.1 球面的Legendre 对偶

7.2 求解Minkowski I 问题

第八章反射镜曲面设计

8.1 反射镜设计问题

8.2 具有均匀反射性质的表面

8.3 广义解和广义Legendre 变换

8.4 存在性和唯一性定理

8.5 最优传输的观点

8.6 反射曲面设计的计算方法

第九章折射透镜设计

9.1 折射透镜设计问题

9.2 具有均匀折射特性的区面

9.3 广义解和广义Legendre 变换

9.4 存在唯一性定理

9.5 折射透镜设计的算法

第四部分流体力学方法

第十章流体动力学

10.1 Euler 观点和Lagrange 观点

10.2 时变速度场的流

10.3 不可压缩流体的Euler 方程

10.4 可压缩流体的连续性方程

10.5 Arnold 几何化理论

第十一章依赖时间的最优传输理论

11.1 依赖时间的最优传输

11.2 McCann 插值

11.3 平移凸性

11.4 最优性方程

第十二章Benamou-Brenier 理论

12.1 Benamou-Brenier 定理

12.2 Otto 的理论解释

12.3 最大熵原理

12.4 Benamou-Brenier 泛函和公式

12.5 Benamou-Brenier 算法

12.6 Angenent-Haker-Tannenbaum 算法

第五部分Monge-Ampère 方程

第十三章Monge-Ampère 方程

13.1 Monge-Ampère 方程的退化性

13.2 Alexandrov 解

13.3 Dirichlet 问题

13.4 Alexandrov 二分法和C1 正则性

第十四章Monge-Ampère 方程解的估计

14.1 最大椭球引理

14.2 归一化解的Alexandrov 估计

14.3 解的严格凸性

14.4 解的C1,α 估计

14.5 最优传输映射正则性

第十五章最优传输映射的奇异集合理论

15.1 Fréchet 距离与自由空间

15.2 最优传输映射的奇异点

15.3 奇异点存在的曲率条件

15.4 power 中轴

15.5 次级多面体理论

15.6 奇异点同伦

第六部分计算方法

第十六章基于Delaunay 三角剖分的网格生成

16.1 三角剖分

16.2 增量凸包算法

16.3 Delaunay 三角剖分和Voronoi 图

16.4 Delaunay 细化算法

第十七章Monge-Ampère 方程的数值方法

17.1 Monge-Ampère 方程的数值方法

17.1.1 显式解法

17.1.2 半隐式解法

17.1.3 线性化Monge-Ampère 算子

17.2 Oliker-Prussner 方法

17.2.1 离散化

17.2.2 分段线性凸函数的Legendre 变换

17.2.3 迭代算法

第十八章半离散最优传输算法

18.1 半离散最优传输

18.1.1 胞腔测度的导数

18.1.2 泛函导数

18.2 Alexandrov 问题

18.3 最差传输映射

第七部分人工智能方面的应用

第十九章最优传输在人工智能上的应用

19.1 流形分布定则

19.2 流形嵌入定理

19.3 万有逼近定理

19.4 生成模型

19.5 模式坍塌和模式混淆

19.6 几何生成模型

参考文献

名词索引

最优传输理论与计算 ——雷娜 顾险峰 【新书发布】相关推荐

  1. 最优传输理论与计算 学习笔记1

    次微分的例子: 考虑凸函数f(x)=|x|.在原点的次微分是区间[−1, 1]. 紧集: 在数学中,如果欧几里得空间 Rn 的子集是闭集合且是有界的,那么称它是紧致的. 利普希茨连续: 在数学中,特别 ...

  2. 最优传输理论和生成模型的几何观点

    ©PaperWeekly 原创 · 作者|尹娟 学校|北京理工大学博士生 研究方向|随机过程.复杂网络 论文标题:A Geometric View of Optimal Transportation ...

  3. 中国人工智能学会通讯——最优传输理论在机器学习中的应用 1.1 最优传输理论与 WGAN 模型...

    最优传输理论是连接几何和概率的桥梁, 它用几何的方法为概率分布的建模和衡量概 率分布之间的距离提供了强有力的工具.最 近,最优传输理论的概念和方法日益渗透进 机器学习领域,为机器学习原理的解释提供 了 ...

  4. 光影变幻:自动化所基于最优传输理论的影视换脸技术

    本文转载自中国科学院自动化研究所. (影视剧换脸结果 素材来源自网络) 科技改变影视生态 赋予机器类人创造力,使之能够自动理解和编辑影像是人工智能领域的前沿方向. 中科院自动化所智能感知与计算研究中心 ...

  5. TPAMI 2022|基于最优传输理论的无监督图像重建学习

    作者丨王炜 来源丨上海交通大学类脑智能应用与技术中心 编辑丨极市平台 论文地址:https://ieeexplore.ieee.org/document/9763342 开源地址代码:https:// ...

  6. 海天讲座(四)最优传输理论

    由于原链接公式看不到,所以转了下,如有侵权,联系删除 2016 公元2016年2月11日上午,加州理工学院,麻省理工学院以及"激光干涉引力波天文台(LIGO)"的研究人员在华盛顿宣 ...

  7. 海天讲座(二)最优传输理论

    由于原链接公式看不到,所以转了下,如有侵权,联系删除 2016 这篇文章里说了应用最优传输理论解保面积参数化问题,之前有看过将保面积参数化转化为线性问题的文献,效果也不错. 图1. 最优传输理论在计算 ...

  8. 统计深度学习与最优传输理论,传统方法vs深度学习,符号主义与联结主义

    统计深度学习与最优传输理论,传统方法vs深度学习,符号主义与联结主义 统计深度学习与最优传输理论 传统计算机视觉方法与基于统计的深度学习方法 符号主义与联结主义    本文多处摘引自当深度学习遇到3D ...

  9. 【转】最优传输理论---(微信公总号:老顾谈几何)顾险峰

    海天讲座(一):最优传输理论 海天讲座(二):最优传输理论 海天讲座(三):最优传输理论 海天讲座(四):最优传输理论 菲尔兹奖青睐的领域:最优传输和蒙日-安培方程

  10. An Intuitive Guide to Optimal Transport|最优传输理论

    An Intuitive Guide to Optimal Transport|最优传输理论 最优传输:最优传输问题最早是由法国数学家蒙日于1780年代提出:其解的存在性被俄国数学家Kantorovi ...

最新文章

  1. swift_035(Swift之第三方库Kingfisher篇)
  2. m_Orchestrate learning system---九、在无法保证是否有图片的情况下,如何保证页面格式...
  3. Linux C编程--string.h函数解析
  4. python爬虫——web前端基础(1)
  5. 面试必问之JVM原理
  6. OFD文件结构--Pages~Page_0~Content.xml
  7. 【转载】Mysql注入点在limit关键字后面的利用方法
  8. 1000套微信小程序源码模板分享下载,各种类型任意选择
  9. html 字符转换 ascii,HTML ASCII
  10. 改变自己,永不会晚!
  11. AI数学基础之:P、NP、NPC问题
  12. 2018中国软件和信息技术服务综合竞争力百强企业名单
  13. mysql全量备份命令_mysql全量备份与增量备份
  14. matlab批量修改指定像素
  15. 数字电子技术-数字逻辑概论
  16. 力扣周赛 第282场 Java题解
  17. 三顾讯时--对讯时新闻发布系统的艰难突破
  18. 手机上怎么录制斗鱼直播视频,直播视频怎么录制
  19. 【转】我的助理辞职了!
  20. 华为手机怎么变鸿蒙系统,刚公布,未来你的华为手机将迎来这些改变→

热门文章

  1. 92套AE抖音快闪模板(精品)
  2. BP算法(误差逆传播算法)简单实现
  3. pyton构建一个计算列表中位数的函数
  4. TPAMI2021语义分割/领域自适应-Domain Adaptation Network with Image Alignment for Unsupervised Semantic Segment
  5. 关键词排名的查询方法
  6. Word插入脚注不显示编号
  7. 一英寸芯片大小_晶圆和芯片的关系_一个芯片有多少晶圆
  8. Ubuntu各类软件推荐
  9. 产品经理学项目管理04:企业管理金字塔
  10. MPS2326 Constant-On-Time (COT) Step-Down Converter DC-DC