大气污染物的运动本质上是非线性的,大量研究表明大气污染物浓度变化具有混沌特性。污染物浓度的变化并不是完全杂乱无章的,而是存在隐含的运动规律。污染物整体的变化过程可以看作周期与非周期变化的空间模式叠加作用的结果。

对于较大的时间尺度,污染物受到周期变化的影响较大,这种周期性是由气象、环境因素的变化(如年、季和日周期)以及人类活动(如人类活动星期效应)共同作用的。

对于一天以内的浓度变化,则存在一些小尺度时空模式。例如大气污染物在传输的过程中受到湍流等气象条件的影响,呈现特殊的运动形态并伴随着一定的间歇性,这种运动形态也被称为相干结构。

上述不同时空尺度的运动规律都可以看作时空动力系统的关键时空演化模式。关键的动力学模式可以精确反映该系统短期和长期行为特征,加深人们对复杂时空动力系统的认识。

Koopman 算符为我们提供了一个有效的数学工具,其主要思想是将一个非线性的时空动力系统映射到一个无限维的线性空间下,并通过线性算符实现系统状态预测。

该方法不依赖于明确的动力学方程,直接从观测数据中挖掘动力系统隐含的时空演化模式。通过 Koopman 算符,能够在得到原时空动力系统非线性特性的同时,保证系统不会丢失任何信息。

本文基于 Koopman 算符,挖掘PM2.5污染过程中的内在动力学模式,识别其增长、衰减或周期震荡等特征,并充分利用深度学习的非线性拟合能力与图神经网络的空间信息嵌入能力。

研究时空动力系统从非线性到线性空间的映射方法,构建融合地理空间信息的深度 Koopman 预测方法(Spatial Physics Constrained Learning framework based on Koopman theory, SPCL)。

Koopman 算符于 1931 年提出,该算符作用在动力系统任意标量函数上,描述了函数沿着任意相空间轨道的演化。时空动力系统的复杂性导致难以用较为准确的动力学方程来近似描述,只能获取通过实验或观测得到的系统状态数据。

Koopman 算符能够利用系统状态数据得到系统的动力学演化特征,从而实现系统状态的预测。

考虑一个在N维相空间M上的一个连续动力系统,给定一个初始条件 x0,该点在t时的时空状态可以表示为:

这里Ft表示在相空间 M 下系统状态的演化函数。

定义 Koopman 算符为 Kt,对于希尔伯特空间中的任意一个可观测函数 g, Koopman 算符对于 g 的作用可以表示为:

由于 Koopman 算符是无限维的线性算符,可以对其进行谱分解,假设Koopman 算符只存在离散谱,对于 Koopman 算符 Kt 的任意一个本征函数 ϕ ,在本征值 eλt 处,系统状态随时间演化可以写作:

因此,Koopman 的本征函数可以作为一组基底张成一个新的空间。在新空间下,非线性时空动力系统转化为线性系统,可以使用线性系统的预测方法解决非线性时空动力系统的预测问题,如下图所示。

动态模式分解(Dynamic Mode Decomposition, DMD)是求解 Koopman 算符最常用的方法之一。在 EDMD 计算过程中,基函数的选取至关重要,一组较完备的基函数可以较好地表示 Koopman 算符的本征函数。基函数的选取往往依赖于动力系统的先验知识,具有较大的主观性。

深度学习为 Koopman 本征函数的发现和表示提供了另一种思路,使得模型能够通过数据驱动的方式为强非线性系统提供内在的线性表示。近年来,随着机器学习的飞速发展,不少研究开始尝试使用机器学习方法获得 Koopman算符的精确估计。

其中Brunton[1]等提出的深度神经网络(Deep Neural Networks,DNN)被证明能比其他方法更灵活准确地表征Koopman本征函数。

在动力系统中,变量之间往往存在一定相关关系,尤其在时空动力系统中,不同位置的系统状态相互影响。在 DMD 算法的构建过程中,所有的系统状态在算法输入时统一被组织成快照矩阵,丢失了系统的空间信息。

而在上述深度 Koopman 算符中,自动编码器在进行空间映射时同样忽略了不同位置上系统状态之间的关系。事实上,深度学习与 Koopman 算符的结合使得模型的输入变得更加灵活,也为模型考虑系统空间信息提供了可能性。

本文基于 Azencot等人[2]提出的基于物理约束的深度 Koopman 算符,在状态空间转换过程中加入了地理空间信息表征。

模型主要包括空间信息嵌入、编码-解码、线性动力学预测与逆向动力学逆推步骤。模型将系统状态在t时刻下的观测值xt作为模型输入,结合空间信息将数据组织成图结构gt,利用图表示方法将空间信息嵌入得到ft, ft经过自动编码器实现状态空间的映射,并在线性矩阵的作用下实现新坐标系下状态的演化。最后网络通过一个解码器得到每个图节点上的预测值。

模型中重要的超参数为相空间维度,也就是线性矩阵 C、 D 的维度。在时空动力系统中, Koopman 算符Kt作用在相空间函数上,该空间包含了目标动力系统的所有状态变量。Koopman 模式则描述了观测量在相空间时空演化过程中的动力特征,一个合适的相空间维度能够更好地表达时空动力系统的演化特征。

相空间维度不宜太小或太大。当维数过小时,难以充分分析动力系统的动态特性。当维数过大时,相空间中相点的形成过于稀疏,同时可能会造成噪音干扰。下表展示了不同相空间维度下的平均误差结果,实验表明当维度为 32 时模型取得最高的预测精度。

基于上述超参数的选择,我们对比了 LSTM、 PCL 与 SPCL 模型连续预测 12 步的预测精度,评估指标结果如下表所示。总体来看,基于 Koopman 理论的预测模型与 LSTM 相比,在预测精度上存在明显提升。

以第一步预测为例, PCL 与 SPCL的四项指标较 LSTM 分别提升 18%、 26%(MAE), 15%、 24%(RMSE),相关系数从 0.73 分别提升至 0.83、 0.86, IA 从 0.79 分别提升至 0.89、 0.92。

可以看出,相较于传统的深度学习时序预测模型,基于 Koopman 理论的模型具有更简单的模型结构,但通过状态空间的变换,依然能够通过提取关键信息实现更高精度的预测结果。

[1] LUSCH B, KUTZ J N, BRUNTON S L. Deep learning for universal linear embeddings of nonlinear dynamics[J]. Nature communications, 2018, 9(1): 1-10.

[2] AZENCOT O, ERICHSON N B, LIN V, et al. Forecasting sequential data using consistent koopman autoencoders[C]//International Conference on Machine Learning. PMLR, 2020: 475-485.

MindSpore官方资料

官方QQ群 : 486831414

官网:https://www.mindspore.cn/

Gitee : https : //gitee.com/mindspore/mindspore

GitHub : https://github.com/mindspore-ai/mindspore

论坛:https://bbs.huaweicloud.com/forum/forum-1076-1.html

基于Koopman的大气污染浓度预测相关推荐

  1. 基于神经网络的天气质量指数预测

    基于神经网络的空气质量指数预测 1 项目背景 1.1背景 随着我国经济的快速发展,大量的工厂企业以及尾气排放使得大气环境污染日益严重,所以大气污染的预测防治工作应该加大力度[1].通过预测未来影响空气 ...

  2. 基于神经网络的房屋价格预测

    本课题的主要任务就是通过神经网络对房屋的价格进行预测,这里,我们采用的数据是奥克兰其中一个郊区的房屋价格的数据.在MATLAB中,使用load函数,将数据进行导入,可以看到房屋价格数据如图2.1所示. ...

  3. python数据分析实战:近地面臭氧浓度预测

    文章目录 1.背景 2.数据处理 原始数据中包含哪些信息? 我们需要什么形式的数据? 面对异常数据该如何处理? 3.模型训练 模型选择 交叉验证 调参 优化 结果 代码 1.背景 在上海隔离期间闲来无 ...

  4. python数据挖掘课程设计——基于数据挖掘的森林火灾预测分析(数据代码+数据分析+数据可视化展示)

    基于数据挖掘的森林火灾预测分析 [摘要]随着全球范围性的温室效应,全球气温正逐步升高,为对抗温室效应,森林已经成为我们急需保护的资源,但是火灾时刻威胁着森林资源.为了帮助对抗温室效应.保护森林,本研究 ...

  5. 使用OpenCV与sklearn实现基于词袋模型的图像分类预测与搜索

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 基于OpenCV实现SIFT特征提取与BOW(Bag of Wor ...

  6. NeurIPS-21 | MGSSL: 基于官能团的分子属性预测图网络自监督预训练

    本文介绍一篇来自中国科学技术大学刘淇教授课题组和腾讯量子实验室联合发表的一篇文章.该文章提出了基于官能团的分子属性预测图网络自监督预训练方法MGSSL.MGSSL结合化学领域知识,在大量无标签分子数据 ...

  7. ​易生信-宏基因组积微学术论坛:基于大数据整合准确预测土壤的枯萎病发生...

    博彩众家之长,积微成就突破.为促进我国宏基因组研究领域的学术交流和技术分享,推动微生物组领域的发展,"宏基因组"公众号联合国内外优秀人才组织"易生信-宏基因组 积微学术论 ...

  8. pandas基于时序数据计算模型预测推理需要的统计数据(累计时间、长度变化、变化率、方差、均值、最大、最小等):范围内的统计量、变化率、获得数据集最后的几条数据的统计量、变化率、获得范围内的统计量

    pandas基于时序数据计算模型预测推理需要的统计数据(累计时间.长度变化.变化率.方差.均值.最大.最小等):范围内的统计量.变化率.获得数据集最后的几条数据的统计量.变化率.获得范围内的统计量 目 ...

  9. pandas基于时序数据计算模型预测推理需要的统计数据(累计时间、长度变化、变化率、方差、均值、最大、最小等):数据持续的时间(分钟)、获得某一节点之后的数据总变化量、获得范围内的统计量

    pandas基于时序数据计算模型预测推理需要的统计数据(累计时间.长度变化.变化率.方差.均值.最大.最小等):数据持续的时间(分钟).获得某一节点之后的数据总变化量.获得范围内的统计量 目录

最新文章

  1. opencv中伪彩色applyColorMap函数(C++ / Python)
  2. 网站入口页双栏对称布局实现思路
  3. 启动延时缩短 50%-80%,函数计算发布镜像加速功能
  4. Core 定时任务之HangFire
  5. chrome 插件 页面请求转发_巧用Chrome插件二三事
  6. Java异常处理(2)--异常处理机制及自定义异常
  7. CodeForces 15B Laser
  8. android studio入门
  9. 2022年度基金委九大学部申请注意事项
  10. TF-卷积函数 tf.nn.conv2d 介绍
  11. java timer 序列化_编程达人 应用层timer_如何序列化timer
  12. Servlet的介绍
  13. python不换行空格输出_解决Python print输出不换行没空格的问题
  14. short_open_tag 相关
  15. 递推公式与递归退出的条件
  16. 【codevs1163】访问艺术馆
  17. 寒冬中的一次优雅起舞
  18. Extjs 屏蔽F5
  19. php中$t=date()函数参数意义及时间更改
  20. ❤️❤️❤️前端成神之路必看学习资源(二),建议收藏起来,偷偷学习!!!❤️❤️❤️

热门文章

  1. 学计算机容易得什么病,常用电脑容易得什么病
  2. 2023年10大高薪岗位大揭秘
  3. activiti 实现驳回功能
  4. Linux系统取证学习笔记
  5. 怎样使用Lotus Domino实用程序(Updall, Compact, Fixup) 进行正常和异常维护。
  6. 2021年3月全国计算机等级考试 贵州考点~
  7. Codeforces:896C-Willem, Chtholly and Seniorious(odt模板)
  8. uboot的mmc驱动
  9. 初识IPv6 有状态、无状态地址相关协议
  10. Jersey框架:统一异常处理