PM2.5大家一定都不会陌生,特别是在北京生活的小伙伴们。PM2.5是指大气颗粒物(PM),其直径小于或等于2.5微米。在环境科学中,特指悬浮在空气中的固体颗粒或液滴,是空气污染的主要来源之一。
本文旨在探寻中国五大城市的PM2.5指数的数据情况及变化趋势,发现一些潜在规律并试图找到和PM2.5相关的一些天气因素。

数据整理和清洗

文中采用的数据集下载自Kaggle,基础数据如下:

先使用python对数据集进行了整理,将五张数据表合并为一张表,并删除暂不分析的数据,然后进行数据清洗,剔除其中为NA的数据。
合并后数据格式如下:

其中 PM_US_Post表示PM2.5的数值,时间精确到小时,使用 year、month、day、hour共同描述,即每一天有24条记录, 还有一些字段是专业数据我们会在后面介绍

使用python做了基础数据整理后,我们再使用Tableau进行可视化分析展示
我们先来看一下2010年至2015年,这五大城市的PM2.5指数的大体趋势情况:

我是交互超链接

上图可见,截至2015年,五大城市中,以北京PM2.5指数值最高,广州的PM2.5的指数值最低。
北京、上海、广州、成都自2013年以来PM2.5指数值都持续有所下降,唯独沈阳2013年PM2.5指数升高,目前已经排名第二位。

总体来说PM2.5的指数有所下降,环境问题得到了改善。

让我们再聚焦到2015年,看看PM2.5的数据情况:

我是交互超链接

上图可见,在采样数据基本均匀的情况下,五城市在不同季节呈现出了明显的差异。
在夏季各地的空气质量都是比较不错的,表现最差的北京在夏季PM2.5的平均值也能达到50, 而到了冬季,各地的污染指数都远大于夏季,北京的PM2.5均值达到了120。

我们在来看看具体到每月的情况:

我是交互超链接

PM2.5的分级标准为:

  1. 优 35微克(ug)/每立方
  2. 良 35~75微克(ug)/每立方
  3. 轻度污染 75~115微克(ug)/每立方
  4. 中度污染 115~150微克(ug)/每立方
  5. 重度污染 150~250微克(ug)/每立方
  6. 严重污染 250及以上微克(ug)/每立方

上图可见,拥有最多优质天气的城市是广州,6月份中收获了29个优质天气,全年优质天气最多的月份在九月。而拥有最多严重污染的城市是北京,在12月有8天达到了严重污染。12月也是全年中空气质量最差的一个月。

既然这样,我们就试着分析一下,北京的空气质量这么差到底与哪些因素有关。
我们先看一下北京全年的PM2.5指数及相关几个系数的走势图:

我是交互超链接

这里我们先了解几个指标系数:

  1. DEWP: 露点
  2. TEMP: 温度
  3. PRES:气压
  4. cbwd: 组合风向
  5. Iws: 累积风速
  6. HUMI:湿度
  7. precipitation:降水

依据上图我们简单可以看出,PM2.5的走势跟露点、湿度变化的走势是比较吻合的,而和累计风速则成反向变动。所以我们看在夏季,虽然露点和湿度的曲线变化比较大,但因为风力平稳持续,所以PM2.5曲线平稳。到了冬季大部分日子风力比较弱,PM2.5曲线同露点和湿度曲线变化就非常贴近了。

我们选取1月份PM2.5数值最大的一天,来看看当天的数据变化情况:

我是交互超链接

上图可见13时为全天PM指数最高时段,同时露点和湿度也是峰值,而此时风力相对较小。而风力最大时段是在上午8时,此时PM指数全天最小。
PM2.5确实是个很大的课题,专业程度又比较高,基于目前的字段信息就先分析到这里了,期待后续有了更多的知识和技术积累,能分析出更多有意义的观点了。
ps:CSDN嵌入的Tableau的图表无法交互,点击图表下方 交互超链接 可查看动图

数据之路- 中国五城市PM2.5数据解读相关推荐

  1. python问题中国五城市pm2.5_数据之路- 中国五城市PM2.5数据解读

    PM2.5大家一定都不会陌生,特别是在北京生活的小伙伴们.PM2.5是指大气颗粒物(PM),其直径小于或等于2.5微米.在环境科学中,特指悬浮在空气中的固体颗粒或液滴,是空气污染的主要来源之一. 本文 ...

  2. 数据分析~案例:中国五大城市PM2.5数据分析

    config.py import os # 指定数据集路径dataset_path='./data' # 结果保存路径output_path='./output' if not os.path.exi ...

  3. 中国全国城市列表JSON数据2022最新

    中国全国城市列表JSON数据 2022最新json数据,2022年8月9日更新 最近需要用到中国省市列表的JSON数据 本来想把县也包含进去的,但是数量太多了~ 然后决定到市级别(包含县级市) 中国总 ...

  4. 数据改版 | CnOpenData中国高新技术企业专利统计数据

    CnOpenData中国高新技术企业专利统计数据 一.数据简介   16年1月,我国科技部.财政部.国家税务总局印发修订了2008年首次发布的<高新技术企业认定管理办法>,明确规定了高新技 ...

  5. 数据名称:中国综合社会调查调查数据(CGSS)数据时间跨度:2003-2018年中国综合社会调查(Chinese General Social Survey,CGSS)始于2003年,是我国最早的

    数据名称:中国综合社会调查调查数据(CGSS) 数据时间跨度:2003-2018年 中国综合社会调查(Chinese General Social Survey,CGSS)始于2003年,是我国最早的 ...

  6. Scott Mitchell 的ASP.NET 2.0数据教程之四十五::DataList和Repeater数据排序

    Scott Mitchell 的ASP.NET 2.0数据教程之四十五::DataList和Repeater数据排序(一) 原文 | 下载本教程中的编码例子 | 下载本教程的PDF版 (以后比较长的部 ...

  7. 胖子哥的大数据之路(五)- 数据资源-垄断的壁垒

    一.事件背景 昨天接触到一个客户,政府背景,行业应用,某部委直属的下属企业,算是垄断行业,依托政府资源,手里面掌握着全国XX行业所有的数据.原以为是大数据平台的一个营销对象,聊半天才发现,原来这也是一 ...

  8. 数据改版 | CnOpenData中国工业企业基本信息扩展数据

    CnOpenData中国工业企业基本信息扩展数据 一.数据简介   拉动中国经济的三个产业中,工业企业占有特殊的地位,是推动国内经济发展的重要产业.工业是最主要的物质生产部门,为居民生活.各行业的经济 ...

  9. 数据改版 | CnOpenData中国上市公司股吧评论数据

    中国上市公司股吧评论数据 一.数据简介   国内资本市场构成的重要主体就是上市公司,上市公司是资本市场发展的基石.十多年来,中国的上市公司不断发展壮大,已成为推动企业改革和带动行业成长的中坚力量:另一 ...

  10. 卷皮网大数据之路-《猫友会大数据系列分享》

    猫友会希望建立更多高质量垂直细分社群,本次是"大数据学习交流付费群"的第一次分享. "大数据学习交流付费群"由猫友会联合,斗鱼数据平台总监吴瑞诚,卷皮BI技术总 ...

最新文章

  1. 算法-有向环和拓扑排序
  2. itools下载链接被360警告:虚假招聘网站
  3. 03018_监听器Listener
  4. QT的QClipboard类的使用
  5. php 反射原理,PHP反射机制详解
  6. Android OOM案例分析
  7. Android编译自定义sdk,java – 使用自定义android.bluetooth.而不是在android studio中默认的sdk android.jar中存在一个...
  8. [脚本编程] 过云盾、D盾各种盾shell
  9. Linux下pppd拨号脚本配置(转载)
  10. JS学习总结(8)——数组
  11. 双人成行本地安装X360ce模拟手柄教程xpadder手柄模拟键盘鼠标
  12. 电脑屏幕总是晚上定时开启护眼模式,变成黄色?教你这招解决它
  13. 光伏谋定生态农村-农业大健康·万祥军:太阳能改革生产方
  14. 如何创建sis文件——概叙
  15. Hibernate5的学习笔记(二)
  16. unity GetComponent使用
  17. Mac平台配置OpenGL(glut,glew)
  18. winform 三层(BLL.DAL.MODEL)
  19. C#网络编程(同步传输字符串)
  20. 反向代理神器 Nginx Proxy Manager 中文版(汉化版)

热门文章

  1. 宝立食品IPO股价八连涨 是业绩支撑还是资本迷局?
  2. C++17 实现日期和时间相关编程
  3. 打地鼠程序设计c语言,打地鼠游戏的制作(C语言)含代码.ppt
  4. blast2go mysql_blast2go本地化-2017教程
  5. SSL证书的概念、作用及分类、价格介绍
  6. 11.HCNA-HNTD——文件系统基础
  7. 高级计量经济学及Stata应用 第2版 陈强+stata十八讲+应用STATA做统计分析
  8. css svg做动图,如何制作svg动态图
  9. 关于后盾网yii框架的学习小结(1)--yii模块的安装
  10. 2021年程序员个人年终工作总结10篇