the deep ritz method论文梳理
《The Deep Ritz Method: A Deep Learning-Based Numerical Algorithm for Solving Variational Problems》
Abstract
本文提出了一种基于深度学习的deep ritz方法,该方法用于数值求解变分问题,特别是偏微分方程引出的变分问题。deep ritz是非线性,也可是自适应的(一直不太懂自适应),而且很有可能在相当高维的空间也可以work。这个框架很简单,而且适用于深度学习中的随机梯度下降法。
Deep Ritz Method
1.问题分析
(1)变分问题
H表示试函数集合(这个试函数集合中包含变分问题的解);f是一个给定的函数,表示所考虑系统的外力
这类问题在物理学中十分常见
(2)deep ritz method基于以下一系列想法:
a. 基于深度神经网络,逼近试函数
b. 函数的一个数值积分规则
c. 求解最后优化问题的一个算法
2.构造试函数(用深度神经网络逼近)
(1)神经网络结构如下:
(2)网络由多块组成,每块包括两个全连接层,和一个残差连接
每一块的输入是s,输出是t,s和t都是m维的向量,每一块的公式如下:
(3)整个网络的最终输出:
构造试函数,即变分问题的解
把上式代入1中的变分问题,得到以下的优化问题–即loss函数:
3.随机梯度下降法和积分规则*****
(1)优化问题和SGD
优化问题通常是如下形式:
等式右边的每一项对应一个数据点。N是数据点的个数,通常很大。
用随机梯度下降法求解这个优化问题
L的下标是在{1,2,3,…,N}上均匀分布的随机变量
SGD的关键点是:在计算L的梯度时,不是计算总和,而是随机选取和中的某一项
而实际中,每一次迭代,不是只选择一项,而是一个mini-batch
(GD,BGD,SGD,MBGD)
(2)积分的离散化
把积分看作连续和,区域上的每个点成为数据点
因此,在SGD迭代的每一步,可以选择一个mini-batch离散化积分,mini-batch中的点随机选取,在每个点上使用相同的积分权重
注意:如果我们使用标准的积分规则离散化积分,必然会选择一组固定的点。那么就有可能产生这样的情况:在固定节点的积分最小化了,但是函数本身却没有最小化。那么SGD随机选取一个mini-batch的特性就避免了上面的风险。
此时,SGD公式如下:
对于第k次迭代,{xj,k}是在区域上根据均匀分布随机采样的一组点
为了加速神经网络的训练,使用SGD的Adam版本。
小结:这里应用到的知识点就是积分的离散化,然后和优化方法SGD统一起来了
关于积分的离散化:类似于积分的定义,选取一些离散点,对每个点求和
数值解–试验
1.二维的泊松方程
(1)考虑问题:
(2)所用网络
4块(8个全连接层),数出m=10,一共881个参数
(3)边界作惩罚项:
(4)结果比较
得到的解基本相同DRM参数较少时,解的精度都比FDM高
2.高维的泊松方程
(1)考虑问题:
维度为10
(2)网络
三块(六个全连接层),671个参数,SGD的每一次迭代,从区域中选取1000个点,区域边界选取100个点,惩罚参数为1000
(3)结果
SGD收敛很快;又对每个数据都更新,所以更新很频繁,也因此震荡很严重
the deep ritz method论文梳理相关推荐
- 重生强化【Reincarnating RL】论文梳理
重生强化[Reincarnating RL]论文梳理 文章目录 重生强化[Reincarnating RL]论文梳理 前言: 文章链接: 作者团队介绍: 沈向洋老师的论文十问: 联系方式: 前言: 好 ...
- KDD‘22推荐系统论文梳理(24篇研究36篇应用论文)
2022推荐系统论文梳理系列 推荐系统相关顶会整理 AAAI'22推荐系统论文梳理 IJCAI'22 推荐系统论文梳理 ICML/ICLR'22 推荐系统论文梳理 WWW'22 推荐系统论文之序列推荐 ...
- Procedural Noise Adversarial Examples for Black-Box Attacks on Deep Neural Networks论文笔记
Procedural Noise Adversarial Examples for Black-Box Attacks on Deep Neural Networks论文笔记 0. 概述 如今一些深度 ...
- RecSys‘22 推荐系统论文梳理
2022推荐系统论文梳理系列 推荐系统相关顶会整理 IJCAI'22 推荐系统论文梳理 ICML/ICLR'22 推荐系统论文梳理 WWW'22 推荐系统论文之序列推荐篇 WWW'22 推荐系统论文之 ...
- ACL/NAACL‘22 推荐系统论文梳理
2022推荐系统论文梳理系列 推荐系统相关顶会整理 IJCAI'22 推荐系统论文梳理 ICML/ICLR'22 推荐系统论文梳理 WWW'22 推荐系统论文之序列推荐篇 WWW'22 推荐系统论文之 ...
- 【论文解读】关于基于视觉无人机自主降落平台的论文梳理
关于基于视觉无人机自主降落平台的论文梳理 一 : 基于视觉导航的旋翼无人机自主降落系统 文章结构: 逐文解读: 无人机自主降落过程视觉定位方法研究 文章结构 逐文解读: 多旋翼无人机自主精准降落的控制 ...
- WSDM‘22推荐系统论文梳理
2022推荐系统论文梳理系列 推荐系统相关顶会整理 IJCAI'22 推荐系统论文梳理 ICML/ICLR'22 推荐系统论文梳理 WWW'22 推荐系统论文之序列推荐篇 WWW'22 推荐系统论文之 ...
- Deep Face Recognition论文翻译
Deep Face Recognition论文翻译 作者: Omkar M. Parkhi ····································· Visual Geometry ...
- WSDM‘23 推荐系统论文梳理
之前把2022年已公布的推荐系统相关顶会梳理一遍 ,历史推荐系统顶会论文梳理系列文章可以参考公众号或知乎,快捷合辑详见<2022推荐系统顶会论文梳理系列>. WSDM'23已公布录用结果, ...
最新文章
- PostgreSQL专题
- LightGBM和XGBoost使用scale_pos_weight处理不平衡数据源码分析
- 使用此代码可以解决python包导入路径问题?
- |Tyvj|动态规划|P1004 滑雪
- 如何循序渐进有效学习 JavaScript?
- loadrunner发送json_Loadrunner接口测试-发送JSON格式的请求
- spark 上下游shuffle结果的存放获取
- vue 原型设计 拖拽_设计即开发,如何打通软件研发的“任督二脉”?
- 中国天然金红石市场趋势报告、技术动态创新及市场预测
- Atom : C++如何愉快地与之相处?
- 阿里矢量图标库彩色图标(Symbol 引用)
- C实现的UDP压力测试工具
- 笔记本电脑怎么在桌面添加计算机,怎么在笔记本电脑上添加便签,笔记本电脑桌面便签设置密码...
- cmake出错:Building inplace are not allowed. You should create a separate directory for Building.
- 机器学习:局部加权线性回归(Locally Weighted Linear Regression)
- 《矩阵理论与方法》lambda矩阵及Jordan标准形
- CTF比赛的简单了解
- HTML 入门基础教程
- mstsc远程登录windows服务器
- 写在工作的第十年: 谈一谈专注和基础的重要性
热门文章
- APP价格标签页设计灵感!多款案例选择!
- PSD分层素材模板,快速设计美妆类海报
- 建议把英语改成选修的计算机老师,中小学“变动”,英语改为副科?老师没意见家长却愁眉不展...
- SizeOf相关代码
- WEB的发展历程、Tomcat服务器、与HTTP协议
- linux-5.12-rc1-dontuse
- Software-Defined Networking (SDN) Definition-软件定义网络
- php实现多重继承,PHP5 多重继承DEMO方法
- python tkinter载入图片_Python的GUI编程
- python基础其他(二十一)