目录

Improvement of PM2.5 and O3 forecasting by integration of 3D numerical simulation with deep learning techniques

作者及单位:

摘要:

数据

模型:

评估

结果:

总结:


Improvement of PM2.5 and O3 forecasting by integration of 3D numerical simulation with deep learning techniques

将三维数值模拟与深度学习技术相结合,改进PM2.5和O3预测

Sustainable Cities and Society

作者及单位:

Haochen Sun,Jimmy C.H. Fung, Yiang Chen, Wanying Chen, Zhenning Li, Yeqi Huang, Changqing Lin, Mingyun Hu, Xingcheng Lu

香港科技大学数学系

香港科技大学环境与可持续发展部

摘要:

空气污染是城市和社会可持续发展的主要障碍。受排放特征和气象条件的影响,细颗粒物(PM2.5)和臭氧(O3)的形成和破坏较为复杂,准确预测这两种主要二次大气污染物的浓度仍具有挑战性。在本研究中,通过结合地面观测的气象和空气污染物数据和天气研究与预报(WRF)-社区多尺度空气质量(CMAQ)模式模拟,提出了基于长短期记忆层(LSTM)的深度学习模型结构,并应用于未来48 h内PM2.5和O3浓度的预测。通过在CMAQ模拟结果中引入空间修正(SC)方法,将预测改进推广到整个大湾区。与原CMAQ预测相比,新方法PM2.5的平均绝对误差(MAE)和均方根误差(RMSE)分别降低了26%和33%;在O3方面,它还实现了40%的MAE降低和34%的RMSE降低。空间修正(SC)方法应用于整个GBA区域,PM2.5的总MAE和RMSE分别降低了10%和17%,O3的降低了31%和25%。利用人工智能方法,我们的研究为进一步改善空气质量预测提供了新的视角,从时间和空间两个角度,从而提高城市的智慧和弹性,促进该地区的环境可持续发展。

数据

利用粤港澳大湾区地面监测站逐小时地面气象要素和大气污染物浓度观测数据,构建深度学习模型。使用2015年1月1日至2019年12月31日的数据对深度学习模型进行训练,使用2020年1月1日至2020年10月16日的数据对预测结果进行验证。空气污染物浓度的时间分辨率为1 h。气象因子的时间分辨率为1 ~ 6h;对于大于1 h的间隔,采用线性插值方法填补数据缺口。为保证足够的数据质量,在选择污染物监测站进行深度学习模型训练时,采用以下两个标准:

1污染物监测站记录PM2.5、O3、二氧化硫(SO2)、二氧化氮(NO2) 4种空气污染物的有效度均在90%以上。

2对于5个气象因素[地面压力、露点、温度、相对湿度、风速和风向(将风计算为一个因素)]中的每一个,在距离污染物监测站不超过30公里的地方设置一个气象监测站,其有效记录至少有90%。

粤港澳大湾区共有41个污染物监测站达标。对每个监测站,收集指定时段内与气象因子和空气污染物浓度相对应的10个特征的全部记录。以下41个站称为LSTM站。

模型:

WRF-CMAQ模式是一个三维数值气象和化学输运模式,可以模拟气象因子和大气污染物的时空变化。它被广泛应用于空气污染问题研究和空气质量预测。

其大气化学模式使用的是美国国家环境保护署开发的大气化学质量模式CMAQ

气象预报模式采用广泛应用的美国气象界联合开发的中尺度气象模式WRF

LSTM:LSTM (Hochreiter & Schmidhuber, 1997)是RNN的一种变体,具有输出门和遗忘门,使其能够避免梯度爆炸或消失的问题,并提取嵌入在时间序列长段中的信息。因此,LSTM非常适合对时间序列进行处理和预测。在本研究中,对每个(归一化)输入时间序列应用多对一LSTM层。

本研究提出的主要模式是将过去的观测数据与目标小时的WRF和CMAQ结果相结合,对PM2.5和O3浓度进行预报。对于每天d,以上午9点作为参考,模型采用(归一化)地面观测 (10个特征,风速和方向计算为2个特征,和其他空气污染物和气象因素每个算作1特性)。从第d-3天的上午9点到第d天上午8点的数据作为输入,(归一化)WRF和CMAQ结果(各5个特征)从d日上午9点到d+2日上午8点,并预测d日上午9点到d+2日上午8点的PM2.5和O3浓度(48小时被称为时间滞后0 ~ 47 h)。以下简称LWC (LSTM-WRF-CMAQ)模型。


上图:说明了LWC模型的结构。将地面观测时间序列和WRF-CMAQ时间序列分别传递到输出大小为64的LSTM层,并将输出连接起来。对于PM2.5和O3,从串联LSTM输出到最终预测浓度都有一条路径,分别有96、64、48个神经元的三层密集层,这两层隐藏层由ReLU函数激活,ReLU(z) =max{0,z}。值得注意的是,每个模型(与一个LSTM站相关联)都经过训练,可以同时预测PM2.5和O3浓度,每个48维输出层对这两种空气污染物中的一种进行未来48小时的预测。

使用2015年至2019年的数据对41个站点的每个站点训练了一个单独的LWC模型,并使用2020年的数据进行了验证。每个模型由Adam optimizer (Kingma & Ba, 2015)训练256个epoch,初始学习率为每256步10-3乘以0.9的分段学习率衰减计划,L2损耗为最小目标。为了防止过拟合,在每一个致密层之前,采用0.2的丢失率。在此配置下,所有研究的深度学习模型都收敛到满意的损失值,且没有显著的过拟合。

其他提高性能的方法

1.一维卷积(Conv1D)层(Kiranyaz et al., 2021)可以从时间序列中提取特征。理论上,如果在LSTM层之前将输入时间序列输入到Conv1D层和max-pooling层,模型可以得到更准确的结果。Li Hua &吴(2020)显示出更好的性能在卷积神经网络(CNN) -LSTM Conv1D图层的混合模式应用在LSTM层在使用过去的地面观测168 h的PM2.5浓度预测未来24小时,相比之下,模型只包括LSTM和致密层。

在将每个(归一化)输入时间序列输入到LSTM层之前,再对每个(归一化)输入时间序列应用一个带有16个过滤器和内核大小为2的Conv1D层和随后的最大池层(内核大小为2)。其他模型超参数和训练配置保持不变。以下简称为CLWC (CNN-LSTM- WRF-CMAQ)模型。

2. 伽马分布  Gamma distribution

伽玛分布是具有非负支持的正偏态概率分布族。空气污染物的浓度也是非负的,没有上限,这与伽玛分布的支持一致。由于传统的线性上一层激活和损失函数不禁止负值,模型可能产生负预测,特别是当后验分布的期望较小时。这可能会导致后续的数值问题。因此,我们假设Yi|Xi;θ的后验分布服从gamma分布。根据Text S4的推导,这类似于广义线性模型(Nelder & Wedderburn, 1972),采用损失函数

对模型进行训练。为了保持数值稳定性,最后一层的输出由softplus函数

激活,以确保预测的严格正性。对应的模型与LWC模型除了最后一层的激活和损失函数外,在结构上没有区别,下文简称γ模型。

空间校正:

采用基于WRF-CMAQ模型预测的修正方法,将深度学习模型的预测从LSTM站点扩展到整个GBA。对于任意目标位置k,对CMAQ结果的修正计算为LWC预报与CMAQ预报的差值的加权和。̂yk为k位置修正后的预报,计算方法如下:

式中ck为k点CMAQ预报,V是所有LSTM站集合的站点,̂yv和cv分别为分别为V站点的LWC预报和CMAQ预报,权值Wv、k计算如下:

其中d(a,b)表示任意两个位置a与b之间的距离。

为了检验预报延伸的准确性,除41个LSTM站点外,选取另外49个PM2.5和O3无效记录不超过30%的地面观测站进行验证。

评估

1.CMAQ。以PM2.5和O3两种目标污染物的CMAQ结果作为LSTM站点和整个GBA区域预报的基线。

ARIMA

2.Lasso回归(Tibshirani, 1996)是一种被广泛应用的机器学习算法

3.初步LSTM。训练了另一个仅输入地面观测数据的模型。该模型的结构与LWC模型相似,不同之处在于它只包含一个地面观测的输入时间序列,LSTM层的输出大小为128,而不是64,以保持后续密集层不变。该模型下文简称初步LSTM模型。

评估指标:用于评估模型性能的指标为归一化平均误差(NME)、平均绝对误差(MAE)、均方根误差(RMSE)、均方误差(MSE)、对称平均绝对百分比误差(SMAPE)。由于当前模型的偏差是影响预测精度的一个基本问题,因此也使用了观测均值(y)、模拟均值(̂y)和归一化均值偏差(NMB)来评价模型的性能。

结果:

验证:

CMAQ模型在不同的时间滞后中一般都能实现中等的性能。ARIMA、Lasso和初步的LSTM模型在小时滞下取得了令人满意的性能,但它们的性能随着时滞的增加而快速衰减。对于较短的时滞,LWC模型与这些基线模型相比没有显著改善。然而,对于较长的时滞,LWC模型在减少方差方面表现出了很强的效果,从而实现了稳定和令人满意的性能,并在较大时滞的某些指标(如RMSE和R)上显著领先。与CMAQ模型相比,LWC模型在41个站点和48个时滞下的平均MAE降低了26%,RMSE降低了33%,SMAPE降低了17个百分点,R增加了0.17。

预测:

利用2020年1月1日至2020年10月16日的数据测试了CN- 1356A、YL-A和ST-A三个站点的预测性能。观测结果与预测时间序列的趋势基本一致。预测的时间序列有效地捕捉了峰值的发生,但预测的峰值值没有观测值高。观测时间序列在正常值处有较大的波动,这些波动被预测的时间序列部分拟合。由于PM2.5预测的偏差,预测的时间序列普遍高估了PM2.5浓度,特别是2020年6月至8月期间。不同站点PM2.5的高估程度存在差异;例如,在ST-A站观测到比其他两个站更显著的高估。

对于改进模型:CLWC模型和γ模型

与LWC模型相比,整体改善不是很显著。表S1和S2显示了三种模型对PM2.5和O3预测的评价。PM2.5预测的改善主要发生在较长的滞后时间。CLWC模型降低了长时间滞后的正偏差,从而降低了MAE、RMSE和SMAPE。γ模型的相关性有所改善;然而,由于较大的正偏倚,整体误差并没有进一步减小。与PM2.5的预测模式类似,γ模型更有可能高估O3浓度,从而减少了偏差,并在一定的滞后时间内优于LWC模型,后者的偏差为负。然而,CLWC模型对O3预报的改善并不显著。CLWC模型由于其复杂性的增加,比LWC模型更容易过拟合(也可以通过偏差减小和方差增加来验证,如表S1和S2所示)。由于其损失函数的数学性质,γ模型在低地面观测值时容易受到小的观测误差的影响,这可能会急剧增加总体偏差(与γ模型高估两种污染物浓度的趋势一致)。因此,可以预测,CLWC模型(或类似结构)可以应用于数据丰度较高的问题,以减少方差,而γ模型可以应用于污染更严重的情况,从而使低地面观测值不显著。

空间校正的结果

仅使用41个站点不足以预测整个粤港澳大湾区的PM2.5和O3浓度。而空间分辨率为3 km的CMAQ预报则覆盖了整个大湾区。因此,需要SC方法进一步将LWC模型的改进效果从LSTM站点扩展到整个GBA。

图4显示了使用SC方法对49个验证站点的PM2.5预报的评估。由于LWC模型的偏差,SC在所有时间滞后中对PM2.5产生一致的正偏差,而CMAQ模型在不同时间滞后中产生不稳定的变化偏差(表2)。而且,SC显著降低了方差,从而导致MAE和RMSE大幅降低10%和17%(48个时间滞后的平均水平,下同),SMAPE下降5个百分点。在R方面没有显著改善,除了观察到的短时间滞后。

S4-S6显示了SC对3个以距离最近LSTM站区分的站点的PM2.5浓度预测效果(d)。随着性能的提高,性能通常会下降。在d值较小的情况下(如d≤20km的15个站点),除MAE、RMSE和SMAPE降低外,R显著改善。

图5显示了空间扩展对49个SC验证站点O3预报效果的影响。与PM2.5的结果类似,线性相关性没有明显改善。SC消除了CMAQ模型造成的较大正偏差,导致MAE、RMSE和SMAPE大幅下降,MAE和RMSE分别降低了31%和25%,SMAPE降低了8个百分点。S7、S8和S9显示了SC对3个以d值区分的站点的O3浓度预测效果。与PM2.5相似,SC在d值较小的情况下,线性相关性也有较大改善。

以上总结了两种污染物在以d值区分的不同站点的预报表现模式,此可知,构建基于区域三维模型和深度学习模型对区域内一组离散地面观测站进行预测的区域预测系统,需要有一定的站点空间密度,才能保证可接受的精度水平。

图3显示了2020年8月16日至2020年10月16日期间,PM2.5和O3浓度均较高,且波动较大。图6显示了SC对这段时间CMAQ预报结果的影响,滞后时间为26 h。41个LSTM台站和49个SC验证台站的地面观测数据均值也如图所示。地面观测数据在SC图中比在CMAQ图中更顺利地融入背景,特别是O3, SC有效地解决了显著偏差问题。这表明SC比CMAQ模型产生了更准确的预测。

图S10给出了SC在其他时间滞后(分别为0、6、13、20、33、40、47 h)下的效果,其中也可以观察到证明SC有效性的现象。

总结:

由于排放、气象因素和简化参数方案等不确定性因素的影响,CMAQ模型等三维空气质量模型即使在较短的滞后时间内也不能提供非常高的精度预测。然而,由于过去的气象因素和过去的空气污染物浓度之间的相关性较弱,单纯基于过去时间的机器学习技术不能扩展到更长的时间滞后(例如,LSTM是一种基于深度学习的时间序列预测技术,将地面观测数据与WRF-CMAQ模型结果相结合,建立了一种新的LWC模型。该模型继承了三维数值模型预测技术和基于LSTM的深度学习技术的优势,其性能优于单一模型。该模型结构还可以作为一个框架,用于执行其他污染物的浓度预测任务,如SO2、NO2和一氧化碳,使用类似数量的特征和时间序列长度的地面观测和WRF- CMAQ结果。提出并比较了CLWC模型和γ模型;尽管这些在某些方面显示了优势,但它们都没有超越LWC模型的整体性能。最后,结合整体GBA的CMAQ结果和SC方法对LSTM站点LWC模型的预测,将LWC模型的改进效果推广到整体GBA。虽然修正方法的结果不如模型建立区域的结果准确,但仍然达到了优于CMAQ模型的性能水平,从而为GBA提供了更准确的预测。SC方法地面监测站覆盖面积大,可以应用到更大的区域,取得更好的优化效果。本研究提出的方法可以作为一个框架,使空气污染预测具有较高的准确性和较长的视野,使城市对空气污染的响应更加精确。这提高了城市的智慧性和环境弹性,有助于城市和社会的可持续发展。

2021-11-13周报相关推荐

  1. Python中的字符串处理(re正则表达式)by Young 2021.11.13

    写在前面的说明: (1)作者的部分翻译可能和python 标准中文文档之间有出入,作者已尽力保持一致,如有不妥,烦请读者指出,作者一定及时更正: (2)文中介绍的所有内容作者均使用pythong 3. ...

  2. 2021/11/13

    复盘: 7 : 50 − 8 : 50 7:50 - 8:50 7:50−8:50 T 1 T1 T1一看就是道模拟题 , 用 s e t set set维护 , 具体方法就是开 2 ∗ n 2 * ...

  3. 你要记得那些大雨中为你撑伞的人,帮你挡住外来之物的人。。。——村上春树 2021.11.13日 早上11点

    收藏: 村上春树说: 你要记得那些大雨中为你撑伞的人, 帮你挡住外来之物的人, 黑暗中默默抱紧你的人, 逗你笑的人, 陪你彻夜聊天的人, 坐车来看望你的人, 陪你哭过的人, 在医院陪你的人, 总是以你 ...

  4. 2021.11.13 孤尽训练营D19——OAuth2

    OAuth2是什么 OAuth2是目前最流行的授权协议,用来授权第三方应用,获取用户数据. 令牌 vs 密码: 令牌 短期的,自动失效 可以撤销,撤销立即生效 有权限范围,如只能进2号门 密码 长期有 ...

  5. js创建数组的四种方法【2021.11.13】

    参考书籍<JavaScript百炼成仙> 1.直接量定义数组: var arr = [1,2,3]; 2.采用构造函数的方法创建数组对象: var a =new Array(); 3.也是 ...

  6. 2021.11.13 关于大学生竞赛的些许感想,写在党课考试前一晚

      很感谢这一路走来曾经给我帮助和激励的人,包括但不限于:我的算法引路人swj,给我推荐Acwing平台的小天,陪我一起减肥减了20斤的dqq.虽然没有什么成就叭,还是很感谢大家的. 数学建模国二 蓝 ...

  7. 2021.11.13

    goto函数,无条件转移. 昨天对getchar的读入过程有疑问.getchar从键盘缓冲区中读入,那读入后存哪呢? 实际上我们在用它的时候是把它赋给一个变量或直接用在判断语句的,没有存储的问题. 使 ...

  8. NOIP模拟赛2021/11/13考试总结

    赛时安排 8:00~8:40 T1直接用set模拟一下就行了,不知道空间会不会炸,时间应该能卡过 8:40~9:10 写了T2的暴力分 9:10~10:10 T2应该是DP之类的,但是不知道怎么设置状 ...

  9. 第13期微生物组-宏基因组分析(线上/线下同时开课,2021.11)

    福利公告:为了响应学员的学习需求,经过易生信培训团队的讨论筹备,现决定安排扩增子16S分析.宏基因组.Python课程和转录组的线上直播课.报名参加线上直播课的老师可在1年内选择参加同课程的一次线下课 ...

  10. 首页推荐流支持快捷修改兴趣标签,问答支持展示gif【2021.11.8】

    hello,大家好,这里是「CSDN产品周报」第17期.本次更新主要涉及首页和问答两个产品模块,具体细节请往下看. 一.首页优化 1.「推荐」信息流新增「修改兴趣标签」按钮 从用户需求的角度考虑,对内 ...

最新文章

  1. SPSS(|PASW)18 学习笔记(1):入门示例-克山病例
  2. CBU计算机硕士申请难度,电脑开机后CBU百分只百是什么问题
  3. 如何查看服务器并发请求连接数
  4. 外挂编程-动作模拟技术
  5. ASP.NET验证码的实现
  6. java---解析XML文件,通过反射动态将XML内容封装到一个类中
  7. 探索pytest的fixture(上)
  8. 定了!华为的AI技术路线向开发者开放!
  9. 定制MyBatis的日志
  10. 权威!盘点 100 个最受欢迎的 Java 库!绝对经典
  11. 深度集成 Flink: Apache Iceberg 0.11.0 最新功能解读
  12. 2020软考程序员考试大纲要求的必会单词
  13. 微信小程序蓝牙通讯、串口通讯、调试助手(HC-08等 )
  14. 【ICCV2019论文阅读】PU-GAN:点云上采样对抗网络
  15. 向量的各种积,都有哪些,分别如何表示
  16. VC6.0 编译出现fatal error C1083
  17. Winxp U盘无法复制磁盘写保护解决办法。
  18. Function.identity()初探
  19. 常用的无线充发射IC芯片
  20. 57期性能测试_0621

热门文章

  1. Docker 从入门到实践系列一 - 什么是Docker
  2. 超详细的Linux安装Redis单机版教程
  3. matlab 画梯形,转向梯形优化设计matlab程序
  4. contiki学习笔记(一)
  5. UCOSⅢ 任务管理
  6. ZigBee网络路由算法设计
  7. 【Pandas入门教程】如何重塑表格布局
  8. EasyCVR接入大华CVS录像机,下载录像文件名为空是如何解决的?
  9. 3.ARMv7-M exception model(1)
  10. Excel 上传和下载