摘要

文章通过研究收集到2014-2019五年间每月广州平均空气质量指数 (AQI) ,建立多个时间序列模型进行比较,得到最适合的模型预测广州未来空气质量指数。

引言

环境保护与空气质量一直是政府与民众关注的社会热点问题,2019年9月燃烧至今的澳洲山火火势仍未得到控制,山火产生的有毒烟雾正随着季风被吹向全球每个角落;自改革开放以来,中国经济增长迅速,工业化程度与人均汽车拥有量都在稳步提高,以广州为例,2017 年 GDP 总量达 2.15万亿, 2018 年 GDP 总量达 2.3 万亿元,年增长率达 6.9%。 2017 年机动车产量超 310 万辆,位居全国城市之首; 工业规模与机动车数量的不断扩大,广州的空气质量饱受社会关注。
近年来许多学者对于空气质量指数都有独到的研究与分析,陈焕盛【1】 对 2010 年广州气象要素和 PM10 日均浓度进行气象场、排放源的空间对比、时间序列对比、散点分析、统计分析,较为全面地判断气候条件对于空气质量的影响。林植林【2】基于 ARIMA 模型对 2014年广州市日空气质量指数进行预测,其他文献则对空气质量预测标准的合理性进行介绍。
文章使用数据来源为https://www.aqistudy.cn/historydata/monthdata.php?city=%E5%B9%BF%E5%B7%9E(PM2.5历史数据网),收集广州2014-2019五年间每月的平均空气质量指数,对数据进行时间序列分析,通过其 AIC 值、 BIC 值等参数检验计算,提出广州空气质量指数预测模型,预测未来六个月的空气质量指数。

研究思路

收集广州空气质量指数数据,对数据进行时间序列建模,定性与定量分析相结合,研究思路流程图如下

图1: 广州空气质量指数研究思路流程图

文章获取广州市 2014-2019五年间每月平均空气质量指数,利用 Stata15 分析软件构建广州空气质量指数的时间序列分析模型,首先进行数据平稳性检验,判断数据平稳后接着识别模型等等步骤,最后通过理论与实际指数的比较,预测并分析未来广州六个月空气质量指数。

空气质量指数平稳性分析

图2:时间序列图


可以看出,AQI值在70附近剧烈波动,为证明时间序列图的平稳性,对时间序列进行单位根(ADF)检验。

ADF检验表

Dickey-Fuller test for unit root                   Number of obs   =        66---------- Interpolated Dickey-Fuller ---------Test         1% Critical       5% Critical      10% CriticalStatistic           Value             Value             Value
------------------------------------------------------------------------------Z(t)             -6.619            -3.558            -2.917            -2.594
------------------------------------------------------------------------------
MacKinnon approximate p-value for Z(t) = 0.0000

ADF 检验统计量值-6.619,小于 1%显著性水平下的临界值-3.558,拒绝存在单位根的零假设,说明时间序列是平稳的,无单位根存在。

图3:自相关图

图4:偏自相关图


由时间序列的 ACF 与 PACF 图像均拖尾可知,该时间序列模型为 ARIMA 模型,根据时间序列的偏自相关图与自相关图,推测 p 值与 q 值均为 1。为了保证模型更加准确,尝试将多个 ARIMA 模型并分别计算其 AIC 和 BIC 值,判断准则: AIC 与 BIC 值相对越小,模型的拟合效果越优。发现却是 ARIMA(1, 0)模型最优。

模型比较

---------------------------------------------------------------------------(1)          (2)          (3)          (4)          (5)   arma10       arma11       arma20       arma30       arma31
---------------------------------------------------------------------------
aqi
_cons          72.91***     72.86***     72.87***     72.91***     72.84***(31.23)      (31.97)      (31.63)      (29.42)      (32.63)
---------------------------------------------------------------------------
ARMA
L.ar           0.269**      0.127        0.272*       0.272*      -0.530   (2.63)       (0.27)       (2.16)       (2.05)      (-0.85)
L2.ar                                  -0.0316      -0.0421        0.194   (-0.23)      (-0.28)       (1.00)
L3.ar                                                0.0590      -0.0899   (0.34)      (-0.66)
L.ma                        0.145                                  0.808   (0.29)                                 (1.30)
---------------------------------------------------------------------------
sigma
_cons          12.97***     12.96***     12.96***     12.94***     12.90***(11.95)      (11.84)      (11.78)      (11.84)      (11.35)
---------------------------------------------------------------------------
N                 67           67           67           67           67
ll            -266.8       -266.8       -266.8       -266.7       -266.5
aic            539.6        541.5        541.5        543.4        544.9
bic            546.2        550.3        550.3        554.4        558.2
---------------------------------------------------------------------------
t statistics in parentheses
* p<0.05, ** p<0.01, *** p<0.001

模型进一步比较

考虑到一年十二个月的气候相对一致,增加两个模型ARIMA(1 12)(只考虑第十二项滞后)与 **ARIMA(1,12)**进行对比,结果如下:

--------------------------------------------(1)             (2)   arma112        arma1_12
--------------------------------------------
aqi
_cons               73.25***        72.65***(18.17)        (106.46)
--------------------------------------------
ARMA
L.ar                0.675***       -0.544   (3.72)         (-1.89)
L.ma               -0.454           0.882   (-1.66)          (1.63)
L12.ma              0.404*         -0.589** (2.09)         (-3.10)
L2.ma                               0.303   (0.89)
L3.ma                             -0.0304   (-0.08)
L4.ma                              -0.116   (.)
L5.ma                              -0.454*  (-2.32)
L6.ma                              -0.347   (.)
L7.ma                              -0.410   (-1.53)
L8.ma                              -0.204   (-0.50)
L9.ma                               0.167   (.)
L10.ma                              0.214   (0.88)
L11.ma                             -0.416   (-1.11)
--------------------------------------------
sigma
_cons               12.15***        10.17   (9.53)             (.)
--------------------------------------------
N                      67              67
ll                 -264.0          -257.9
aic                 538.0           537.8
bic                 549.0           562.1
--------------------------------------------
t statistics in parentheses
* p<0.05, ** p<0.01, *** p<0.001

模型选择

AIC 信息准则即 Akaike information criterion,是衡量统计模型拟合优良性的一种标准,它建立在熵的概念基础上,可以权衡所估计模型的复杂度和此模型拟合数据的优良性。

BIC 信息准则即 Bayesian Information Criterion, 是主观贝叶斯派归纳理论的重要组成部分。是在不完全情报下,对部分未知的状态用主观概率估计,然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最优决策。
表达式为:

AIC=2k - 2ln(L)
BIC = k*ln(n) - 2ln(L)
(公式中 k为模型参数个数, n 为样本个数, L 为模型极大似然函数值)

因为使用数据样本不大,文章偏重考虑 AIC 值最小的 ARIMA(1,12)模型,模拟效果更优。

诊断与检验

运行程序后将结果汇总在excel表,展示如下:

模拟预测2019年空气质量指数

平均绝对误差为13.36%

预测2020年1-6月空气质量指数

反思

  1. 文章采用 ARIMA模型对广州空气质量指数进行时间序列分析预测,预测结果大体还算满意,个别值的误差较大,有非常大的改进空间,尤其是模型识别部分,如何构建拟合程度最优的模型是今后的研究方向。
  2. 空气污染指数的取值范围定为 0~500,其中 0~50、51~100、 101~200、201~300 和大于 300,分别对应国家空气质量标准中日均值的 I 级、 II 级、 III 级、 IV级和 V 级标准的污染物浓度限定数值,根据预测数值可知广州未来半年将处于II 级的位置,空气质量评估为良,对人体健康无显著影响。广州空气质量持续保持高水平,让本地居民安心进行晨练夜跑等锻炼活动。
  3. 文章在进行模型识别时考虑到月度影响,使得模型更加准确,可并未将政策影响纳入模型参数中,如广州市在 2017 年 10 月出台《广州市环境空气质量达标规划(征求意见稿)》的影响未在模型中体现出来,这时本文模型构建所忽略的部分,也是未来研究的方向之一。

参考文献

  1. 空气质量多模式系统在广州应用及对 PM10 预报效果评估[J]. 陈焕盛,王自发,吴其重,吴剑斌,晏平仲,唐晓,王哲. 气候与环境研究. 2013(04)
  2. 基于 ARIMA 时间序列的广州空气质量分析[J].林植林,莫斌.湖南工业职业技术学院学报,2014,14(04)
  3. 珠三角区域空气质量预报方法及预报效果评估[J]. 叶斯琪,陈多宏,谢敏,谢智,汪宇,潘月云,沈劲,许凡. 环境监控与预警. 2016(03)
  4. 天津市基于新标准的空气质量预报模型效果评估[J]. 高璟赟,杨宁,毕温凯,肖致美,陈魁,李源. 环境监控与预警. 2016(06)
  5. 时间序列分析方法在上海地铁能耗预测中的应用[J].曹嘉晟,杨太华.能源与环境,2019(03)

通过时间序列分析预测未来广州的空气质量指数变化相关推荐

  1. 时间序列分析预测未来 Ⅰ

    时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列. A time series is a series of data point indexed(or li ...

  2. 机器学习-预测之时间序列分析预测法原理及实战

    时间序列分析预测法 简介 在之前,写了不少关于分类的算法,其中有传统机器学习算法如KNN.SVM,也有深度学习领域的算法如多层感知机,但是可以发现这里的算法核心思路都没有变化,利用一部分已有标签的数据 ...

  3. Python通过ARIMA模型进行时间序列分析预测

    ARIMA模型预测 时间序列分析预测就是在已有的和时间有关的数据序列的基础上构建其数据模型并预测其未来的数据,例如航空公司的一年内每日乘客数量.某个地区的人流量,这些数据往往具有周期性的规律.如下图所 ...

  4. 基于LSTM时间序列分析预测拉尼娜年天气

    基于LSTM时间序列分析预测拉尼娜年天气 天气预测 Import all necessary libraries Replace all column names by overwritting on ...

  5. python时间序列指数平滑预测_时间序列分析预测实战之指数平滑法

    一.什么是时间序列分析? 在工作中,常常要对数据进行预测,确定业务未来的发展趋势,进而配置相关的营销策略.制定业务目标,由此引申出了一个重要的用数据预测未来的方法--时间序列分析,今天和大家分享就是实 ...

  6. 时间序列分析预测实战之指数平滑法

    一.什么是时间序列分析? 在工作中,常常要对数据进行预测,确定业务未来的发展趋势,进而配置相关的营销策略.制定业务目标,由此引申出了一个重要的用数据预测未来的方法--时间序列分析,今天和大家分享就是实 ...

  7. 基于R语言的时间序列分析预测

    数据来源: R语言自带 Nile 数据集(尼罗河流量) 分析工具:R-3.5.0 & Rstudio-1.1.453 #清理环境,加载包 rm(list=ls()) library(forec ...

  8. 数学建模学习(63):2022美赛单变量深度学习LSTM 时间序列分析预测

    换汤不换药,有手就会 基础肥皂案例 数据集如下: 你的数据只要能跟它合上就行,年份和数据. 你只需要修改的地方: 套上去就完事,完整代码: # coding=gbk """ ...

  9. 时间序列分析-预测Apple股票价格

    时间序列 数据描述 探索Apple公司股价数据 导入库 import pandas as pd import numpy as npimport matplotlib.pyplot as plt im ...

  10. 时间序列分析-----1---简介

    一.预测 在生活和工作中经常需要作出预测. 比如,预测一只股票价格的走势,预测下一年度的销售额,等等. 预测是人们根据事物的发展规律.历史和现状.分析影响其变化的因素,对其发展的前景和趋势进行的一种预 ...

最新文章

  1. 【量化投资】策略四(聚宽)
  2. 共享一些知识点的学习地址
  3. 世博展示生态化住宅 物联网助推智能化家居
  4. 运行scrapy shell 'http://quotes.toscrape.com'出现错误ValueError: invalid hostname: 'http
  5. 文件操作:fread()和fwrite()
  6. 微信小程序 - 文字收缩与展开
  7. 使用Azure人脸API对图片进行人脸识别
  8. jsp 体检信息查询 绕过用户名验证_一篇彻底搞懂jsp
  9. 【jenkins】jenkins按分支build和email
  10. 24小时学会python_零基础python24小时极速入门学习
  11. 约束理论学习随笔(1)
  12. LVM报错:resize2fs: Bad magic number in super-block
  13. View的setLayerType() , setDrawingCacheEnabled() 方法用法
  14. liux环境下配置jdk
  15. mac使用fish的时候添加可执行文件路径
  16. 安装双系统(ubantu和window10)失败后,如何找回数据及格式化被加密的U盘
  17. 云桌面优缺点_云桌面中VDI架构有什么优势和劣势?
  18. Junit 4 的使用
  19. ucserver admin.php,Discuz!X3.2 升级后ucenter、uc_server正确密码却无法登录后台的解决方法...
  20. 智慧交通篇 2 —— 公交刷卡(非接触IC卡)系统全透析

热门文章

  1. 深光标准技术:谷歌GMS认证是什么?谷歌AER认证是什么?GMS认证的费用跟周期是多少??
  2. android 大屏幕平台,手机大屏新玩法 体验MHL全能应用平台
  3. shell下office、html、pdf文档互转方法
  4. 前端实现 导出图片,导出PDF(截图原理)
  5. FastDFS 入门小 Demo( 图片上传)
  6. 注册机偷懒写法1、之直接扣代码
  7. 未来计算机行业哪个吃香,男孩子未来最吃香的十大行业
  8. 怎样从零开始训练一个AI车手?
  9. 郑明秋什么版本的MySQL_mysql数据库实用教程教学课件作者郑明秋代码数据库脚本代码9787568250825.docx...
  10. 使用httpclient调用url出现错误Illegal character in scheme name at index 0解决方案