《The Deep Ritz Method: A Deep Learning-Based Numerical Algorithm for Solving Variational Problems》

Abstract

本文提出了一种基于深度学习的deep ritz方法,该方法用于数值求解变分问题,特别是偏微分方程引出的变分问题。deep ritz是非线性,也可是自适应的(一直不太懂自适应),而且很有可能在相当高维的空间也可以work。这个框架很简单,而且适用于深度学习中的随机梯度下降法。

Deep Ritz Method

1.问题分析

(1)变分问题
H表示试函数集合(这个试函数集合中包含变分问题的解);f是一个给定的函数,表示所考虑系统的外力
这类问题在物理学中十分常见
(2)deep ritz method基于以下一系列想法:
a. 基于深度神经网络,逼近试函数
b. 函数的一个数值积分规则
c. 求解最后优化问题的一个算法

2.构造试函数(用深度神经网络逼近)

(1)神经网络结构如下:

(2)网络由多块组成,每块包括两个全连接层,和一个残差连接

每一块的输入是s,输出是t,s和t都是m维的向量,每一块的公式如下:
(3)整个网络的最终输出:
构造试函数,即变分问题的解

把上式代入1中的变分问题,得到以下的优化问题–即loss函数:

3.随机梯度下降法和积分规则*****

(1)优化问题和SGD
优化问题通常是如下形式:
等式右边的每一项对应一个数据点。N是数据点的个数,通常很大。
用随机梯度下降法求解这个优化问题
L的下标是在{1,2,3,…,N}上均匀分布的随机变量
SGD的关键点是:在计算L的梯度时,不是计算总和,而是随机选取和中的某一项
而实际中,每一次迭代,不是只选择一项,而是一个mini-batch
(GD,BGD,SGD,MBGD)
(2)积分的离散化
把积分看作连续和,区域上的每个点成为数据点
因此,在SGD迭代的每一步,可以选择一个mini-batch离散化积分,mini-batch中的点随机选取,在每个点上使用相同的积分权重
注意:如果我们使用标准的积分规则离散化积分,必然会选择一组固定的点。那么就有可能产生这样的情况:在固定节点的积分最小化了,但是函数本身却没有最小化。那么SGD随机选取一个mini-batch的特性就避免了上面的风险。
此时,SGD公式如下:
对于第k次迭代,{xj,k}是在区域上根据均匀分布随机采样的一组点
为了加速神经网络的训练,使用SGD的Adam版本。
小结:这里应用到的知识点就是积分的离散化,然后和优化方法SGD统一起来了
关于积分的离散化:类似于积分的定义,选取一些离散点,对每个点求和

数值解–试验

1.二维的泊松方程

(1)考虑问题:

(2)所用网络
4块(8个全连接层),数出m=10,一共881个参数
(3)边界作惩罚项:

(4)结果比较
得到的解基本相同DRM参数较少时,解的精度都比FDM高

2.高维的泊松方程

(1)考虑问题:
维度为10

(2)网络
三块(六个全连接层),671个参数,SGD的每一次迭代,从区域中选取1000个点,区域边界选取100个点,惩罚参数为1000
(3)结果

SGD收敛很快;又对每个数据都更新,所以更新很频繁,也因此震荡很严重

the deep ritz method论文梳理相关推荐

  1. 重生强化【Reincarnating RL】论文梳理

    重生强化[Reincarnating RL]论文梳理 文章目录 重生强化[Reincarnating RL]论文梳理 前言: 文章链接: 作者团队介绍: 沈向洋老师的论文十问: 联系方式: 前言: 好 ...

  2. KDD‘22推荐系统论文梳理(24篇研究36篇应用论文)

    2022推荐系统论文梳理系列 推荐系统相关顶会整理 AAAI'22推荐系统论文梳理 IJCAI'22 推荐系统论文梳理 ICML/ICLR'22 推荐系统论文梳理 WWW'22 推荐系统论文之序列推荐 ...

  3. Procedural Noise Adversarial Examples for Black-Box Attacks on Deep Neural Networks论文笔记

    Procedural Noise Adversarial Examples for Black-Box Attacks on Deep Neural Networks论文笔记 0. 概述 如今一些深度 ...

  4. RecSys‘22 推荐系统论文梳理

    2022推荐系统论文梳理系列 推荐系统相关顶会整理 IJCAI'22 推荐系统论文梳理 ICML/ICLR'22 推荐系统论文梳理 WWW'22 推荐系统论文之序列推荐篇 WWW'22 推荐系统论文之 ...

  5. ACL/NAACL‘22 推荐系统论文梳理

    2022推荐系统论文梳理系列 推荐系统相关顶会整理 IJCAI'22 推荐系统论文梳理 ICML/ICLR'22 推荐系统论文梳理 WWW'22 推荐系统论文之序列推荐篇 WWW'22 推荐系统论文之 ...

  6. 【论文解读】关于基于视觉无人机自主降落平台的论文梳理

    关于基于视觉无人机自主降落平台的论文梳理 一 : 基于视觉导航的旋翼无人机自主降落系统 文章结构: 逐文解读: 无人机自主降落过程视觉定位方法研究 文章结构 逐文解读: 多旋翼无人机自主精准降落的控制 ...

  7. WSDM‘22推荐系统论文梳理

    2022推荐系统论文梳理系列 推荐系统相关顶会整理 IJCAI'22 推荐系统论文梳理 ICML/ICLR'22 推荐系统论文梳理 WWW'22 推荐系统论文之序列推荐篇 WWW'22 推荐系统论文之 ...

  8. Deep Face Recognition论文翻译

    Deep Face Recognition论文翻译 作者: Omkar M. Parkhi ····································· Visual Geometry ...

  9. WSDM‘23 推荐系统论文梳理

    之前把2022年已公布的推荐系统相关顶会梳理一遍 ,历史推荐系统顶会论文梳理系列文章可以参考公众号或知乎,快捷合辑详见<2022推荐系统顶会论文梳理系列>. WSDM'23已公布录用结果, ...

最新文章

  1. PostgreSQL专题
  2. LightGBM和XGBoost使用scale_pos_weight处理不平衡数据源码分析
  3. 使用此代码可以解决python包导入路径问题?
  4. |Tyvj|动态规划|P1004 滑雪
  5. 如何循序渐进有效学习 JavaScript?
  6. loadrunner发送json_Loadrunner接口测试-发送JSON格式的请求
  7. spark 上下游shuffle结果的存放获取
  8. vue 原型设计 拖拽_设计即开发,如何打通软件研发的“任督二脉”?
  9. 中国天然金红石市场趋势报告、技术动态创新及市场预测
  10. Atom : C++如何愉快地与之相处?
  11. 阿里矢量图标库彩色图标(Symbol 引用)
  12. C实现的UDP压力测试工具
  13. 笔记本电脑怎么在桌面添加计算机,怎么在笔记本电脑上添加便签,笔记本电脑桌面便签设置密码...
  14. cmake出错:Building inplace are not allowed. You should create a separate directory for Building.
  15. 机器学习:局部加权线性回归(Locally Weighted Linear Regression)
  16. 《矩阵理论与方法》lambda矩阵及Jordan标准形
  17. CTF比赛的简单了解
  18. HTML 入门基础教程
  19. mstsc远程登录windows服务器
  20. 写在工作的第十年: 谈一谈专注和基础的重要性

热门文章

  1. APP价格标签页设计灵感!多款案例选择!
  2. PSD分层素材模板,快速设计美妆类海报
  3. 建议把英语改成选修的计算机老师,中小学“变动”,英语改为副科?老师没意见家长却愁眉不展...
  4. SizeOf相关代码
  5. WEB的发展历程、Tomcat服务器、与HTTP协议
  6. linux-5.12-rc1-dontuse
  7. Software-Defined Networking (SDN) Definition-软件定义网络
  8. php实现多重继承,PHP5 多重继承DEMO方法
  9. python tkinter载入图片_Python的GUI编程
  10. python基础其他(二十一)