什么是PM2.5


pm为英文particulate matter的缩写,翻译成中文叫做颗粒物。pm2.5是指大气中直径小于或等于2.5微米的颗粒物,有时也被称作入肺颗粒物。我们日常常见的雾霾天气大 多数情况下就是由pm2.5造成的。虽然pm2.5在大气中的含量极少,但是,由于质量小,携带病毒及有害物质时间长、传输渠道多样、移动距离较远、对人 体和大家环境质量造成的危害较大,pm2.5的确是名符其实的隐型杀手!

但是随着北京的大力治理,比如二氧化硫浓度降幅64.3%、淘汰167万辆老旧机动车、城六区整治千条背街小巷、原生垃圾实现无害化处理等等措施,北京PM2.5下降近四分之一, 我们终将赢得蓝天(来源北京娱乐信报)。

百度指数也给出了我们同样结论。数据从2013年1月到2018年6月,PM2.5指数明显在降低,也可以说是逐年减少。

了解了这些以后,我们切换到今天的主题,Python分析北京地区PM2.5。

环境


环境:MAC + Python3.6

数据集获取


我们首先使用pandas包中read_csv文件读取数据集。该数据集包含2013年以来,美国大使馆和我国给出的每一个月的 PM 值。然后使用pandas包中基本数据方法进行数据预览,主要包括,数据集整体预览、前10行查看、数据文件的基本信息等。具体代码如下:

def collect_data():'''STEP1: 收集数据'''data_pd = pd.read_csv(os.path.join('./data/pm/Beijing_PM.csv'))return data_pd def inspect_data(data_pd):'''STEP2: 描述数据'''print('数据文件中一共有{}行,{}列'.format(data_pd.shape[0],data_pd.shape[1]))print('数据预览')print(data_pd)print('数据的前5行')print(data_pd.head)print('数据文件的的基本信息')print(data_pd.info())print('数据内容的统计信息')print(data_pd.describe())

运行结果截图如下

数据集共26280行,7列,占用1.4M内存,数据类型为int or float。

每年平均值分析


根据上面的数据集,首先分析的是每年的平均值,查看逐年变化情况。本次分析使用的技术点主要是分组,也就是根据年份(year)进行分组,然后使用柱形图进行可视化结果。从下面的两个图(PM chian mean vs PM us mean)可以看出,无论美国大使馆还是我国给出的PM数据,每年的PM值都在减少,说明我国治理卓有成效,终将获得蓝天。

为了更方便查看我国和美国使馆检测的每年平均PM2.5值的对比,我们可以使用python中的堆叠柱状图可视化,如下图所示。两个机构给出的数据没有很大的差异。具体的技术点主要是使用pandas包中的plot.bar函数,但是可视化之前需要先分组处理数据。具体代码,可以回复PM2.5获得。

#堆叠柱状图可视化filter_mean.plot.bar(stacked=True)plt.title('Mean PM 2.5')plt.tight_layout()plt.savefig(os.path.join(output_path,'filter_mean.png'))plt.show()

可视化结果如下

四季分析


四季分析主要是从四个季度进行对比分析。从下图可以看出,PM最高的季度是第四季,也就是冬天的时候雾霾最为严重。主要使用的技术点是使用箱形图分析。箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。

 #绘制盒形图函数boxplotsns.boxplot(x='season',y=var,data = data_df)plt.savefig(os.path.join(output_path,'year_'+var+'.png'))plt.show

运行效果如下:

每月以及每小时分析


从每月的分析看出,每年的11月、12月、1月最为严重。在每月里面,早晚高峰的时间更为严重。本次可视化的技术点是使用散点图。

def analyze_dual_variables(data_df,var1,var2):'''查看双变量的关系,散点图'''sns.jointplot(x=var1,y=var2,data=data_df)plt.savefig(os.path.join(output_path,var1+'_'+var2+'_sandian.png'))plt.show()

运行效果图

也可以使用透视表可视化每一个月的PM, 具体如下

按小时分析

相关性分析


相关性分析主要用到的技术点是热点图,以及相关性计算。利用热力图可以看数据表里多个特征两两的相似度,具体代码如下:

def analyze_variable_relationship(data_df):'''可视化变量关系热图'''#绘制出所有变量直接的关系,形成一个矩阵#corr计算相关系数corr_df = data_df.corr()#热图sns.heatmap(corr_df,annot=True)plt.savefig(os.path.join(output_path,'heatmap_df.png'))plt.show()

效果如下:

从上面各个角度分析,我们可以看出北京地区的PM2.5真的在减少,每年都有减少。但是大气污染排放源体系构成复杂、时空变化较快,对有关研究解析工作提出了巨大挑战。有关政府部门应当加大与科研机构合作的力度和广度,进一步全面准确掌控PM2.5的污染源数据,让清洁空气行动获得更为有力的技术支撑,让大气污染防治工作可以聚焦重点污染领域精准发力、持续用力,最终让北京收获更多蓝天(来源人民网)。

零基础学Python,看这里

课程形式:永久可看,已更新完成,共计80多课时间

学习形式:视频教学、永久有效,移动端、PC端都可以学,随时随地打开充电

市场定价:109,目前98

还送福利:  赠送价值 69 元的 Python 实战圈,手把手教学

购买方式:长按扫码购买,最好电脑购买,课程购买链接放在下面的  阅读原文

请相信我们,一个有情怀的平台,小码哥出品,必为精品!

每一个课对我们来讲都是自己的孩子

每一门课对我们来讲都是自己的精华

每一门课对我们来讲都是自己的责任

我们不是韭菜收割机,我们是播种情怀,效果证明一切

利用 Python分析北京雾霾天,发现这么秘密相关推荐

  1. Python分析北京PM2.5,原来每年的值都在变少......

    什么是PM2.5 pm为英文particulate matter的缩写,翻译成中文叫做颗粒物.pm2.5是指大气中直径小于或等于2.5微米的颗粒物,有时也被称作入肺颗粒物.我们日常常见的雾霾天气大 多 ...

  2. 利用Python分析航空公司客户价值

      利用Python分析航空公司客户价值 一.背景介绍 随着社会生活中数据量的急剧增多,如何从这些海量的数据中提取与发掘出对我们决策有用的信息成为当前亟待解决的题,因此,数据分析与挖掘技术在这些年得到 ...

  3. 利用Python分析《庆余年》人物图谱和微博传播路径

    利用Python分析<庆余年>人物图谱和微博传播路径 庆余年电视剧终于在前两天上了,这两天赶紧爬取微博数据看一下它的表现. 庆余年 <庆余年>是作家猫腻的小说.这部从2007年 ...

  4. 数据分析作业(一)利用Python分析学生成绩

    利用Python分析学生成绩 一.题目描述 二.解题步骤 运行环境 题目分析 三.完整代码 四.运行结果 五.参考文献 附录 附录A 更新记录 附录B 相关练习题目 练习一:读取Excel文件数据表分 ...

  5. python单词软件哪个好_利用Python分析背单词软件的惊人真相

    摘要:利用python分析背单词软件,揭秘你不知道的惊人真相 0×00 前言 你想知道背单词软件有大概多少人注册第一天都没有背完嘛 你想知道背单词软件这么火,这么多人在使用,真的有多少人真的在背诵嘛 ...

  6. 利用Python分析文章词频,并生成词云图

    利用Python分析文章词频,并生成词云图 使用request模块获取文章数据 import jieba import requests import csv from bs4 import Beau ...

  7. 北京雾霾越来越重的原因找到了!

    ► 近年来,一到冬季,中国的很多城市便会被雾霾包围,而且雾霾天气出现的频率也是越来越高,持续时间也越来越长.其中,北京雾霾天气尤其引发关注.以往,人们总是将雾霾出现的原因归结于快速的工业化和城市化导致 ...

  8. python财务报表分析-浅谈利用Python分析财报找到值得投资的好公司的想法

    17年12月份接触到了007战友林晓燕老师的不读财报不出局,才知道投资股票还有那么多门道,也了解到了MJ老师挑选股票的标准--五大关键数字力. 跟着林老师开始学习财报以来,老是觉得光靠人工来挑选符合& ...

  9. 利用python分析电商_Python实现爬取并分析电商评论

    现如今各种APP.微信订阅号.微博.购物网站等网站都允许用户发表一些个人看法.意见.态度.评价.立场等信息.针对这些数据,我们可以利用情感分析技术对其进行分析,总结出大量的有价值信息.例如对商品评论的 ...

  10. ppt python 图表_利用python分析weibo数据做成图表放入PPT中

    起因 很久以前,就有个想法,就是自动分析微博的数据,但是之前一直想的是网页版展示,flask想学了好久都没学,偶然的一次看到了一篇关于python处理pptx的文章,再加上同窗三年的室友在毕业后竟然主 ...

最新文章

  1. Django 路由分发
  2. 信息系统监理师题库_信息系统监理题库
  3. 阿里云系列——3.企业网站备案步骤---2018-1-4
  4. 智能集群理论优化控制_探索群体智能的奥妙——ROB-MAS多智能体协作
  5. Smarty模板技术学习
  6. python安装json模块_python 标准模块之json 模块
  7. 用nodejs框架Ghost快速搭建自己的网站
  8. 计算机组成原理实验单周期处理,计算机组成原理实验报告1-单周期.doc
  9. Java解码aac,Android MediaCodec解码AAC,AudioTrack播放PCM音频
  10. 微信小程序商城毕业设计毕设作品(6)任务书
  11. java程序设计-飞机大战
  12. 激活Navicat premium12时出现“Rsa public key not find“报错时的解决方法
  13. 如何使用鲁大师进行驱动备份
  14. ios 二维码扫描(微信二维码扫描音效)
  15. 数学期望、方差、标准差
  16. VON矿链资本的技术含量内幕是什么?尊皇社区为你揭秘!
  17. 关于扫描二维码下载app功能实现方法
  18. 模拟实现内存动态分区分配与回收
  19. 如何做好职业规划(乾卦)
  20. 解决winnt.h(389): error C2059: 语法错误:“;”

热门文章

  1. idea护眼主题全套设置
  2. Source Insight 4.0黑色仿IDEA主题
  3. 川土微 | CA-IS3105W 全集成 DC-DC 转换器
  4. keil5 最新版注册机 下载
  5. 研磨设计模式读书笔记
  6. Mathtype公式编辑器常用快捷键
  7. html+css静态页面Demo(参考一唯科技官网)
  8. 从终端直接下载cuDNN
  9. 电力系统——基于10机39节点的电力系统仿真(Matlab)
  10. C# Winform开发框架源码 Winform系统开发 图书借阅系统,图书管理系统,说明文档齐全