近日,美国艾尔弗·斯隆基金会(The Alfred P. Sloan Foundation)公布了2019年斯隆研究奖(Sloan Research Fellowships)获奖名单,华裔学者鬲融获此殊荣。

鬲融 2004 年从河北省保送至清华大学计算机系,是首届清华姚班毕业生,普林斯顿大学计算机科学系博士,曾在微软研究院新英格兰分部做博士后,2015年至今在杜克大学担任助理教授。

斯隆研究奖自1955年设立,每年颁发一次,旨在向物理学、化学和数学领域的这些“早期职业科学家和学者提供支持和认可”,后来陆续增加了神经科学、经济学、计算机科学、以及计算和进化分子生物学。2019届斯隆研究奖获奖者共126名,其中,含鬲融在内共有19位华人学者获奖。

斯隆研究奖历来有“诺奖风向标”的美誉。因为迄今为止,已有47位该奖项获奖人获得了“诺贝尔奖”。另有17位获奖人获得了“数学菲尔兹奖”,69位获奖人获得“美国国家科学奖章”,18位获得“约翰·贝茨·克拉克奖”。

鬲融求学期间有许多突出事迹,可谓是天才少年,在这篇文章中有较为详细的叙述,以及这之后在读博期间获得了 NIPS 2016 的最佳学生论文奖。下面我们着重介绍一下他近期的研究成果。

鬲融的研究领域为理论计算机科学和机器学习。他在个人主页上写道“深度学习等现代机器学习算法尝试从数据中自动学习有用的隐含表示。那么我们要如何公式化数据中的隐含结构,以及如何设计高效的算法找到它们呢?我的研究就以非凸优化和张量分解为工具,通过研究文本、图像和其他形式的数据分析中出现的问题,尝试解答这些疑问。”

鬲融的研究有三个主要课题:表示学习(Representation Learning)、非凸优化(Non-convex Optimization)以及张量分解(Tensor Decompositions)。此次获得斯隆研究奖,正是基于鬲融在非凸优化方面的研究。根据他本人介绍:“现在机器学习大多使用深度学习算法,这些算法需要通过解决一些非凸优化问题来找到最优的神经网络参数。理论上非凸优化在最坏情况下是非常困难的,但是实际上即使是非常简单的算法(比如梯度下降gradient descent)都表现很好。我最近的工作对于一些简单的非凸优化问题给出了一些分析,可以证明所有的局部最优解都是全局最优解。”

他还补充道:“科研中感觉有些问题一开始看来完全没有头绪,但是有几个特别感兴趣的问题我一般会每隔一段时间再看一下。现在理论机器学习方向发展很快,往往过了一段时间就有很多新的技术可以尝试。其实一开始研究非凸优化的问题是为了解决张量分解的问题(这个是我之前做的研究),但是开始做了之后才发现我们用的工具在很多其他问题中也非常有效。”

不仅此次获奖的研究结论“简单的非凸优化中所有的局部最优解都是全局最优解”对机器学习领域的研究人员们来说是一个令人欣慰的结论,鬲融更多关于别的课题的研究论文也发表在了NIPS、ICML、ICLR等顶级人工智能学术会议上。雷锋网 AI 科技评论下面列举一些。

  • Learning Two-layer Neural Networks with Symmetric Inputs,借助对称输入学习双层神经网络. ICLR 2019.https://arxiv.org/abs/1810.06793

  • Understanding Composition of Word Embeddings via Tensor Decomposition,通过张量分解理解词嵌入的成分. ICLR 2019.https://openreview.net/forum?id=H1eqjiCctX

  • Stronger generalization bounds for deep nets via a compression approach,通过压缩方式为深度神经网络赋予更强的泛化边界. ICML 2018.https://arxiv.org/abs/1802.05296

  • Minimizing Nonconvex Population Risk from Rough Empirical Risk,从粗糙的经验风险中最小化非凸种群风险. NeurIPS 2018.https://arxiv.org/abs/1803.09357

  • Beyond Log-concavity: Provable Guarantees for Sampling Multi-modal Distributions using Simulated Tempering Langevin Monte Carlo,超越对数凹面:通过仿真时序郎之万蒙特卡洛实现采样多模态分布的可证明保证. NIPS 2017 Bayesian Inference Workshop. NeurIPS 2018.https://arxiv.org/abs/1812.00793

  • Global Convergence of Policy Gradient Methods for Linearized Control Problems,用于线性化控制问题的策略梯度方法的全局收敛性. ICML 2018.https://arxiv.org/abs/1801.05039

  • Learning One-hidden-layer Neural Networks with Landscape Design,通过曲面设计学习单层隐层的神经网络. ICLR 2018.https://arxiv.org/abs/1711.00501

  • Generalization and Equilibrium in Generative Adversarial Nets (GANs),对抗性生成式网络的泛化性和均衡研究. ICML 2017.https://arxiv.org/abs/1703.00573

  • No Spurious Local Minima in Nonconvex Low Rank Problems: A Unified Geometric Analysis,低阶非凸问题中不存在虚假的局部极小值:一个统一的几何分析. ICML 2017.https://arxiv.org/abs/1704.00708

  • How to Escape Saddle Points Efficiently,如何高效地离开驻点.  ICML 2017.https://arxiv.org/abs/1703.00887

  • On the Optimization Landscape of Tensor decompositions,关于张量分解的优化图像.NIPS 2016 非凸 workshop 最佳理论研究奖.https://sites.google.com/site/nonconvexnips2016/files/Paper8.pdf

  • Matrix Completion has No Spurious Local Minimum,矩阵期满中不存在虚假的局部极小值. NIPS 2016 最佳学生论文奖.http://arxiv.org/abs/1605.07272

  • Provable Algorithms for Inference in Topic Models,话题模型中可证明的推理算法. In ICML 2016.http://arxiv.org/abs/1605.08491

  • Efficient Algorithms for Large-scale Generalized Eigenvector Computation and Canonical Correlation Analysis,几个高效的大规模泛化特征向量计算和规范关联分析算法. ICML 2016.http://arxiv.org/abs/1604.03930

  • Rich Component Analysis,富成分分析. In ICML 2016.http://arxiv.org/abs/1507.03867

  • Intersecting Faces: Non-negative Matrix Factorization With New Guarantees,相交的截面:带有新的保证的非负矩阵乘法. ICML 2015.http://arxiv.org/abs/1507.02189

  • Un-regularizing: approximate proximal point and faster stochastic algorithms for empirical risk minimization,反规范化:用于经验风险最小化的逼近近似点和更快的随机算法. ICML 2015.http://arxiv.org/abs/1506.07512

  • 此外他还有多篇论文发表在各年的 COLT(Annual Conference on Learning Theory,ACM 主办,计算学习理论顶级会议) 中。

他的个人主页见https://users.cs.duke.edu/~rongge/

————

编辑 ∑Pluto

来源:雷锋网

更多精彩:

☞泰勒定理的奇闻轶事

☞丘成桐:漫谈微分几何

☞Leibniz 如何想出微积分?(一)

☞线性相关和秩的物理意义

☞数学史上你认为最丑陋的公式是什么?

☞陶哲轩谈什么是好的数学

☞田渊栋:数学的用处(下篇)

☞你绝对没想过原来数学家这么流氓,一言不合就进行暴力证明

☞世界上最牛的五篇博士论文

☞数学中有哪些巧合让人眼前一亮?

☞算法立功!清华毕业教授美国被抢车,警察无能为力自己用“贪心算法”找回

☞学术史上的奇文:怎样用数学抓狮子

☞台大教授的反思:最难的一课 我们却没教给学生

麻省理工学院(MIT)研究生学习指导—— 怎样做研究生

分享 数学,常识和运气 ——投资大师詹姆斯·西蒙斯2010年在MIT的讲座

算法数学之美微信公众号欢迎赐稿

稿件涉及数学、物理、算法、计算机、编程等相关领域,经采用我们将奉上稿酬。

投稿邮箱:math_alg@163.com

姚班天才少年鬲融凭非凸优化研究成果获得斯隆研究奖相关推荐

  1. 清华姚班陈丹琦等27位华人学者获奖,斯隆奖2022年获奖名单颁布!

    整理 | 于轩 出品 | 程序人生 (ID:coder _life) 近日,素有"诺奖风向标"之称的斯隆研究奖颁布了2022年获奖名单.斯隆研究奖于1955年设立,每年颁发一次,旨 ...

  2. 清华姚班陈丹琦等27位华人学者获奖,斯隆奖2022年获奖名单颁布

    近日,素有"诺奖风向标"之称的斯隆研究奖颁布了2022年获奖名单.斯隆研究奖于1955年设立,每年颁发一次,旨在支持和奖励处于职业生涯早期的杰出科学家和学者.本次共有118位科学研 ...

  3. 机器学习+优化问题的种类、如何优化、凸优化、非凸优化、对偶问题、KKT条件

    机器学习+优化问题的种类.如何优化.凸优化.非凸优化.对偶问题.KKT条件 目录

  4. 干货丨从基础知识到实际应用,一文了解「机器学习非凸优化技术」

    文章来源:机器之心 优化作为一种研究领域在科技中有很多应用.随着数字计算机的发展和算力的大幅增长,优化对生活的影响也越来越大.今天,小到航班表大到医疗.物理.人工智能的发展,都依赖优化技术的进步. 在 ...

  5. 斯坦福助理教授马腾宇:ML非凸优化很难,如何破?

    作者 | 马腾宇 编译 | 陈萍.杜伟 来源 | 机器之心 非凸优化问题被认为是非常难求解的,因为可行域集合可能存在无数个局部最优点,通常求解全局最优的算法复杂度是指数级的(NP 困难).在近日的一篇 ...

  6. 【机器学习】凸集、凸函数、凸优化、凸优化问题、非凸优化问题概念详解

    目录 1 基本概念 2 凸优化问题 3 非凸优化问题 4 总结 1 基本概念 (1)凸集和非凸集 凸集是一个点集, 这个点集有一个性质, 就是在这个集合中任取不同的两个点x和y, 他们之间的线段(包括 ...

  7. 老王决策规划算法凸优化与非凸优化

    自动驾驶决策规划算法第一章第二节 凸优化与非凸优化 梯度下降法(按每个点一阶导的正负的反方向迭代,如果某个点的一阶导是负的,则下个点取正方向的一个点,反之则取负方向的一个点,迭代的步长取决于导数绝对值 ...

  8. Python 机器学习 | 超参数优化 黑盒(Black-Box)非凸优化技术实践

    文章目录 一.关键原理 二.Python 实践 CSDN 叶庭云:https://yetingyun.blog.csdn.net/ 一.关键原理 为什么要做超参数优化? 机器学习建模预测时,超参数是用 ...

  9. 他是清华姚班的天才少年,17 科满分传奇,32 岁斩获“诺贝尔风向标”斯隆奖...

    本文经授权转载自微信公众号:量子位 ,原作者:李根,转载请联系出处. 当我们在谈论天才时,我们究竟在谈论什么? 是他们先天就有的聪慧.原生家庭的影响,还是在求学受教中不断得以循循引导的环境? 今天要介 ...

最新文章

  1. Python回顾与整理12:执行环境
  2. springboot 引入jdbc驱动_Spring Boot:企业常用的 Starter以及实现
  3. 安卓开发 登录用户信息缓存_小程序云开发之用户注册登录
  4. OSI七层-相关协议
  5. MVC是架构模式,而不是设计模式
  6. P6139-[模板]广义后缀自动机(广义 SAM)
  7. python中seaborn画swarm图_Python可视化 | Seaborn5分钟入门(四)——stripplot和swarmplot
  8. Java 数据结构与算法面试 链表
  9. Sublime Text插件
  10. chrome浏览器安装包点击无反应
  11. 微信签名错误解决步骤
  12. 周鸿袆讲座:互联网软件的微创新和用户体验(转)
  13. 2014黑帽大会揭露十大恐怖安全漏洞!
  14. 住院病人主要由护士护理,这不仅需要大量的护士,而且不能随时观察危重病病情,会延误抢救时机以计算机为中心的患者监护系统,写出系统的可行性。并可以系统印出某个指定病人的病情报告。...
  15. yum -- Failed connect to mirrors.aliyuncs.com:80; No route to host
  16. 股指期货交易流程(股指期货交易规则详解)
  17. VS2015制作服务程序安装包
  18. Java从网上读取docx文件到内存
  19. Ethernet(以太网) 物理介质(10Base、100Base-T、100Base-TX等)
  20. H264文件封装MP4文件

热门文章

  1. HTML 显示特殊字符时转义操作
  2. linuxoracle查看用户权限_权限管理系统设计过程
  3. java虚拟机内存模型种类_深入理解volatile类型——从Java虚拟机内存模型角度
  4. 电机速度曲线规划2:S形速度曲线设计与实现
  5. PID控制器改进笔记之四:改进PID控制器之设定值响应
  6. Go Concurrency Patterns: Context
  7. [设计模式] ------ 模板模式
  8. java 抽样_beta分布的采样或抽样(java程序)
  9. 未能初始化appscan应用程序现在将关闭_企业区块链应用程序的两个关键问题
  10. 高级java技术web组件_(重温)JavaWeb--Servlet技术(二)(JavaWeb 的三大组件之一)...