原标题:Python数据可视化:2018年北上广深空气质量分析

作者:法纳斯特,Python爱好者,专注爬虫,数据分析及可视化

就在这周偶然看到一个学弟吐槽天津的空气,不禁想起那段厚德载雾,自强不吸的日子。

无图无真相,下图为证。

左边的图是去年2月份的时候,这样的空气真的难得一见!

右边的是吐槽以及我个人第一次买口罩!!!

口罩用的还行,因为那个时候做课设,经常要两个校区跑,基本上空气不好我就会带上。

题目好像是有关液压及气压的传动系统,手画A0图...

这应该是快两年前的事了,时光飞逝呐。

所以这回先对2017年天津的空气质量情况进行分析,然后再是北上广深。

/ 01 / 网页分析

网站没有反爬,所以直接抓取信息就好了。

看见没有,妥妥的严重污染,2016年12月份买的口罩派上用场啦!

这里简单给大家科普一下有关AQI,PM2.5的知识。

又是重操旧业,我的PPT水平还是很水呢~

/ 02 / 数据获取

获取代码如下所示。

importtime

importrequests

frombs4 importBeautifulSoup

headers = {

'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'

}

fori inrange(1, 13):

time.sleep(5)

# 把1转换为01

url = 'http://www.tianqihoubao.com/aqi/tianjin-2017'+ str("%02d"% i) + '.html'

response = requests.get(url=url, headers=headers)

soup = BeautifulSoup(response.text, 'html.parser')

tr = soup.find_all('tr')

# 去除标签栏

forj intr[1:]:

td = j.find_all('td')

Date = td[0].get_text().strip()

Quality_grade = td[1].get_text().strip()

AQI = td[2].get_text().strip()

AQI_rank = td[3].get_text().strip()

PM = td[4].get_text()

withopen('air_tianjin_2017.csv', 'a+', encoding='utf-8-sig') asf:

f.write(Date + ','+ Quality_grade + ','+ AQI + ','+ AQI_rank + ','+ PM + 'n')

成功获取数据。

/ 03 / 天津

同样不上源码,这里有必要说一波,因为我觉得源码放上去排版就不好看了...

其次我要秉承以前混迹P圈(PPT)得到的优良传统,热爱分享,百度云盘你值得拥有。

所以公众号回复天气。即可获取全部可视化源码及相关文件。

以前天天去下载PPT大神的大作,然后观摩,可惜的是PPT水平还是那么菜~

01 AQI全年走势图

92.5是年均AQI值,从上面科普知识里可以知道,2017年天津整体空气质量只能是「良」中的下下等水平,与轻度污染近在咫尺。

02 AQI月均走势图

从月均的走势图就能看出,1月的空气质量最差,8月的空气质量最好,当也并不是有多好,充其量也就是个「良」!

03 AQI季度箱形图

箱形图,显示一组数据分散情况资料的统计图。

数据里有最大值、最小值、中位数和两个四分位数。

这里可以看出,2017年天津的季度AQI均值差距不是很大。

但是一、二、四季度有明显的波动,空气质量有时会变得很差。

04 PM2.5全年走势图

59.87是年均PM2.5值,已经远超过国家二级标准限值35了。

其实天津给我留下的印象就是天气经常灰蒙蒙,时常还会变点颜色,比如黄色~

一年下不了几次雨,及其干燥。所以那个最低值11,我猜那时候估计是刮大风。

05 PM2.5月均走势图

和AQI的走势差不多,同样是1月最高,8月最低。

06 PM2.5季度箱形图

说实话,看了这个图,我不知道天津的「大哥」及「姐姐」们是如何做到自强不吸的。

基本上四个季度都超标了,一年不超标的估计也就那么几次。

07 PM2.5指数日历图

日均PM2.5国家二级标准为75,从上面的热力图看,基本上轻度污染过半了。

另外一月还是重灾区,天色黄黄的...

其实每逢雾霾,基本上就是待宿舍了。而且1月份是考试月,刚好窝宿舍预习课本~

08 天津全年空气质量情况

「良」和「轻度污染」占了大头,「优」只能在角落里瑟瑟发抖,足以说明空气之差。

不过该上课还是要上课,谁叫那时宿舍和教室离得近(走过去5分钟不到)。

/ 04 / 北上广深

01 北上广深AQI全年走势图

北京月均AQI最低也就50左右,看来今年全年差不多都在「优」以下了。

不过相比前几年,京津冀空气已经好了不少(政策),真的。

上海和广州差不多,深圳与北京算是鲜明对比。

02 北上广深PM2.5全年走势图

北京一如既往的高调。

03 北上广深全年空气质量情况

深圳几乎都是「优」和「良」,上海和广州和上面说的一样,北京的「优」已经不少了。

那么你所在的城市空气质量又是如何?

关注本公众号回复天气。即可获取全部源码。

责任编辑:

python空气质量分析报告_Python数据可视化:2018年北上广深空气质量分析相关推荐

  1. Python数据可视化:2018年北上广深空气质量分析

    感谢关注天善智能,走好数据之路↑↑↑ 欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答.求职一站式搞定! 对商业智能BI.大数据分析挖掘.机器学习, ...

  2. Python数据可视化:2018年北上广深空气质量分析(附完整代码)

    ♚ 法纳斯特,Python爱好者,喜欢爬虫,数据分析以及可视化. 就在这周偶然看到一个学弟吐槽天津的空气,不禁想起那段厚德载雾,自强不吸的日子. 无图无真相,下图为证. 左边的图是去年2月份的时候,这 ...

  3. (七)CDA 数据分析师Level1考试新版大纲解析(自己整理)PART 7 业务分析报告与数据可视化报表

    PART 7 业务分析报告与数据可视化报表(占比 15%) 总体要求 理解业务分析报告与数据可视化报表的制作方法.能够结合业务需求撰写正确的业务分析报告,能够结合业务需求创建全面的数据可视化报表 1. ...

  4. 北上广深租房信息分析

    北上广深租房信息分析 分析目的 根据链家网北上广深四个城市的所有租房数据(时间节点:2019年2月25日),数据共有105258条. 分析不同地区,租房的高低主要与哪些因素有关 不同的因素导致的房价差 ...

  5. js 处理十万条数据_Python数据可视化2018:为什么这么多的库?

    在奥斯汀举行的SciPy2018特别会议上,许多开源Python可视化工具的代表分享了他们对于Python数据可视化未来发展的不同观点.我们听到了关于Matplotlib,Plotly以及VisPy等 ...

  6. 大数据告诉你,北上广深哪里最容易吃到你的家乡味儿?

    作者 | 钟 黛编辑 | 李晶禹 DT君在北京读大一的表妹,第N+1次打电话让家人从内蒙寄来奶疙瘩和牛肉干了.妈妈的爱心特快专递沿着京藏高速寄了一趟又一趟,而表妹还是抱怨在北京喝不到热乎的马奶酒. & ...

  7. python的最大绘图速度_Python数据可视化之高速绘图神器PyQtGraph库,强烈建议收藏...

    01为什么使用PyQtGraph库 我们知道,在Python中,已经有了很多可供选择的数据可视化库. 比如最经典.使用人数最多的matplotlib库,其有着十多年的历史积累,可生成高质量出版级别的图 ...

  8. python做动态折线图_Python数据可视化 pyecharts实现各种统计图表过程详解

    1.pyecharts介绍 Echarts是一款由百度公司开发的开源数据可视化JS库,pyecharts是一款使用python调用echarts生成数据可视化的类库,可实现柱状图,折线图,饼状图,地图 ...

  9. python中文显示不出来_Python数据可视化利器Matplotlib,无法显示中文,怎么办?...

    原标题:Python数据可视化利器Matplotlib,无法显示中文,怎么办? matplotlib无法显示中文主要是因为默认字体不是中文字体,所以我们只需设置一下字体行了. 文字字体设置主要有两种方 ...

最新文章

  1. 每日英语:Losing It at the Movies: Silly Beats Sober in China's Box Office
  2. Tomcat - ClassFormatException的解决方法
  3. Win系统复制粘贴失效解决办法
  4. Java | Java语言在Eclipse控制台输入的三种方法
  5. mysqld: [Warning] World-writable config file ‘/etc/my.cnf‘ is ignored.问题解决
  6. android 接收SDCcard插拔的广播
  7. 10分钟python游戏_牛得一批!10分钟用Python编写一个贪吃蛇小游戏
  8. php跨域请求解决方案_解决TP接口跨域问题
  9. 父母延长退休,作为程序员的我光荣失业
  10. 干货|设计师都收藏的9个实用灵感网站!
  11. 开放集合目标检测任务 Open-set Detection
  12. php源码 学校版 cms,闪灵CMS学校建站系统(含小程序)
  13. 我奋斗了十八年不是为了和你一起喝杯咖啡
  14. MCE | 单胺能 非单胺能对抑郁症的作用
  15. c语言作用域详解,C语言之作用域
  16. 张艾迪(创始人):世界前三大互联网公司
  17. IM即时通讯软件开发之扫码登录功能
  18. 360搜索引擎so自动收录php改写方案——适合phpcms等cms
  19. 如何使用旁白设置 Apple Watch?
  20. delphi学习基础资料

热门文章

  1. 动态规划是真的难啊坚持
  2. Python读入CIFAR-10数据库
  3. Go 语言 练习 聊天室 01
  4. 信号处理:傅立叶变换的波形分辨率和频率分辨率
  5. torch.cat同时连接多个tensor
  6. Resnet的pytorch官方实现代码解读
  7. 详解平衡二叉树(AVL),红黑树与平衡二叉树的区别
  8. oracle 一行转多行,oracle 一行变多行
  9. leetcode_add_two_numbers
  10. 【算法】梯度消失与梯度爆炸