Tableau中国五城市六年PM2.5数据挖掘
数据来源于kaggle平台,本文对中国五城市(北京、上海、成都、广州、沈阳)六年PM2.5数据,进行分析,为了更加直观,我采用倒叙的方式,先展示成果,再展示数据预处理部分。
推荐阅读:
matplotlib实用绘图技巧总结
Python 数据可视化–Seaborn绘图总结1
Python数据可视化–Seaborn绘图总结2
Tableau数据分析-Chapter01条形图、堆积图、直方图
Tableau数据分析-Chapter02数据预处理、折线图、饼图
Tableau数据分析-Chapter03基本表、树状图、气泡图、词云
Tableau数据分析-Chapter04标靶图、甘特图、瀑布图
Tableau数据分析-Chapter05数据集合并、符号地图
Tableau数据分析-Chapter06填充地图、多维地图、混合地图
Tableau数据分析-Chapter07多边形地图和背景地图
Tableau数据分析-Chapter08数据分层、数据分组、数据集
Tableau数据分析-Chapter09粒度、聚合与比率
Tableau数据分析-Chapter10 人口金字塔、漏斗图、箱线图
Tableau中国五城市六年PM2.5数据挖掘
文章目录
- 3. 数据可视化
- 3.1 PM2.5平均分布情况
- 3.2 时间关系
- 3.2.1 各季节变化情况
- 3.2.2 逐年、季度、月、日变化趋势
- 3.3 风速的关系
- 3.3.1 PM2.5与各城市风速关系
- 3.3.2 北京PM2.5与风速关系图
- 3.3.3 除了北京外地区
- 3.4 降水量的关系
- 3.4.1 上海小时降水量
- 3.4.2 累计降水量
- 3.5 温度关系
- 3.6 相对湿度关系
- 3.7 大气压强关系
- 3.8 温度差关系
- 1. Excel数据预处理
- 1.1 数据探索
- 1.2 数据预处理
- 2. Python合并多个工作表
3. 数据可视化
3.1 PM2.5平均分布情况
北京空气质量最差,广州和上海空气质量最好。成都因地处四川盆地,工业污染难以被风吹散,空气质量较其它南方城市较差。
3.2 时间关系
3.2.1 各季节变化情况
五个城市连续六年PM2.5大小在一年四季的分布,广州和上海的空气质量比较适宜
3.2.2 逐年、季度、月、日变化趋势
- 可以看到,PM2.5总体是逐年下降的
- 观察每天各个时段的PM2.5分布更有意义可以看到各此视下午2点的PM2.5平均值最低
3.3 风速的关系
3.3.1 PM2.5与各城市风速关系
PM2.5与风速的关系,点击查看单个城市的情况。风速越大,PM2.5越低。
3.3.2 北京PM2.5与风速关系图
PM2.5与风速的关系,仅显示北京。刮大风总是会刮西北风。
3.3.3 除了北京外地区
可以看出成都的刮风是非常小的,广州次之
3.4 降水量的关系
PM2.5大小与降水量的关系(默认只显示上海)。
3.4.1 上海小时降水量
降水量越大的时候,PM2.5越低。
可以看到,2013-9-13日的降水量特别大,上海发生了大暴雨
3.4.2 累计降水量
PM2.5大小与累计降水量的关系。累计降水量越大,PM2.5越低。
3.5 温度关系
由于北京的散点图掩盖了其他城市,所以我们用筛选器取出了北京,可以看到,成都是比较热的,上海温差较大,沈阳最冷
3.6 相对湿度关系
PM2.5大小与相对湿度的关系(默认不显示北京广州),当相对湿度较高时,成都、上海、沈阳数据都出现了断续,并且大致符合:相对湿度越高、PM2.5的平均值越高的分布情况
- 原因解释:
3.7 大气压强关系
感觉没有太大关系
3.8 温度差关系
露点温度指空气在水汽含量和气bai压都不改变的条件下,冷却到饱和时的温度。
形象地说,就是空气中的水蒸气变为露珠时候的温度叫露点温度。露点温度本是个温度值,可为什么用它来表示湿度呢?这是因为,当空气中水汽已达到饱和时,气温与露点温度相同;当水汽未达到饱和时,气温一定高于露点温度。所以露点与气温的差值可以表示空气中的水汽距离饱和的程度。气温降到露点以下是水汽凝结的必要条件
1. Excel数据预处理
首先要对原始数据进行数据处理,主要时替换操作,Excel的vlookup函数就够了,当然也可以利用pandas中的映射关系来做,就有点大材小用了。
1.1 数据探索
数据字段
字段含义
- No: row number 行号
- year: year of data in this row 该行中数据的年份
- month: month of data in this row 该行中数据的月份
- day: day of data in this row 该行中数据的日期
- hour: hour of data in this row 该行中的小时数据
- season: season of data in this row 此行中的数据季节
- PM: PM2.5 concentration (ug/m^3) PM2.5浓度(ug / m ^ 3)
- DEWP: Dew Point (Celsius Degree) 露点(摄氏温度)
- TEMP: Temperature (Celsius Degree) 温度(摄氏温度)
- HUMI: Humidity (%) 湿度(%)
- PRES: Pressure (hPa) 压力(hPa)
- cbwd: Combined wind direction 组合风向
- Iws: Cumulated wind speed (m/s) 累积风速(m / s)
- precipitation: hourly precipitation (mm) 每小时降水量(毫米)
- Iprec: Cumulated precipitation (mm) 累积降水量(毫米)
数据结构
数据展示
1.2 数据预处理
- 季节替换
- 风向替换
- PM2.5数据处理
- 时间转换
处理完5个EXCEL表格数据后,就要合并多个工作表,Python比较在行
2. Python合并多个工作表
# -*- coding:utf-8 -*-
# @Author : https://blog.csdn.net/qq_45176548
# @Time : 2021/2/4 0:25
import pandas as pd
import os
os.chdir(r"E:\Python\五省PM2.5")
path = "./archive/"
dfs,index = [],0
for i in os.listdir(path):dfs.append(pd.read_csv(os.path.join(path,i)))print(f"正在合并{index+1}工作表")index += 1
df = pd.concat(dfs)
df.to_csv("./archive/北上广成沈五城市六年PM2.5数据汇总.csv",index=False)
到这里就结束了,如果对你有帮助,欢迎点赞关注,你的点赞对我很重要
Tableau中国五城市六年PM2.5数据挖掘相关推荐
- 中国五十六个民族列表
以后要养成一个习惯,把常用的代码保存到自己的 "代码库",虽说资料网上都有,但是有些经过自己验证的代码,如果能自己建立自己的库的话,将来也是一笔财富.所以,今天给自己的博客添加了 ...
- 中国五十六个民族下拉列表源代码
中国五十六个民族下拉列表源代码 <asp:DropDownList ID="dropNationality" runat="server"> < ...
- python问题中国五城市pm2.5_数据之路- 中国五城市PM2.5数据解读
PM2.5大家一定都不会陌生,特别是在北京生活的小伙伴们.PM2.5是指大气颗粒物(PM),其直径小于或等于2.5微米.在环境科学中,特指悬浮在空气中的固体颗粒或液滴,是空气污染的主要来源之一. 本文 ...
- 中国五十六个民族简介
56个民族是中华人民共和国灿烂星空中(五十六个星座). 中华民族共包括56个民族,汉族是中国的主体民族,占全部人口的91.51%,其他还有55个民族,占8.49%(第六次人口普查).汉族和55个少数民 ...
- 中国五个城市(北上广、成都、沈阳)PM 2.5含量分析
中国五个城市(北上广.成都.沈阳)PM 2.5含量分析 简介 PM2.5的检测数值通常包含在环境部门和公司的空气质量报告中. PM2.5是指大气颗粒物(PM),其直径小于或等于2.5微米.在环境科学中 ...
- 数据分析~案例:中国五大城市PM2.5数据分析
config.py import os # 指定数据集路径dataset_path='./data' # 结果保存路径output_path='./output' if not os.path.exi ...
- 中国智慧城市发展潜力研究报告发布 北深杭上广居前五
25日,<2018中国智慧城市发展潜力研究报告>与"智慧城市潜力榜"发布. 魏晞 摄 25日,<2018中国智慧城市发展潜力研究报告>与"智慧城市 ...
- 中国智慧城市前瞻及开发运营可行性分析报告2022-2027年版
第一章 鸿晟信合视点 1.1 行业投资要点 1.2 报告研究思路 第二章 智慧城市的概念界定及产业链分析 2.1 智慧城市的定义及应用 2.1.1 智慧城市的定义 2.1.2 智慧城市的应用 2.2 ...
- 界面今日头条:2018年中国旅游城市排行榜
2018年忙碌大半,中秋和国庆长假即将来临,因此旅行计划成了热门议题.中国上下五千年,历史悠久,地大物博,江河湖海,草原高山,应有尽有.具体到中国大陆的各个城市,因其历史传承和资源禀赋的不同,而展现出 ...
- 2023-2029年中国无线城市建设行业发展形势分析及投资规划分析报告
2023-2029年中国无线城市建设行业发展形势分析及投资规划分析报告 报告编号:1665923 免费目录下载:http://www.cninfo360.com/yjbg/qthy/qt/202210 ...
最新文章
- 时隔两周,我给阎王设计的地府CRM终于做完了
- 发送邮件_使用 Python 发送电子邮件
- 关于MQTT、HTTP、WebService
- Scrapy学习之第一个简单爬取小程序
- JAVA 设计模式 职责链模式
- 2万字总结《MybatisPlus—为简化开发而生》
- 特征向量、标签、模型、算法
- zabbix为啥持续报警
- 一起重新开始学大数据-java篇-DAY13-ArrayList集合和装拆箱
- matlab编程复指数,matlab复指数序列
- Android画一条虚线
- android仿美团评论
- APP消息智能推送有什么特点
- 星空主题设计理念_请星星设计理念
- 刘盈盈计算机科学与技术,关于成立乐清市中小学幼儿园新教师专业发展指导师团队的通知...
- 《面朝大海,春暖花开》(海子)
- 【译】视觉吸引力在网页设计中的重要性
- 使用openCV与C++求图片特征值及特征向量并进行图片处理
- ENVI软件学习笔记(1)
- 英语学习得建议和忠告 附送下载资料无数
热门文章
- python的csv安装_Python csv模块:处理csv文件
- Maya 展UV和贴图
- e430c更换光盘托架_如何处理PC上未使用的光盘驱动器托架
- 待机、休眠、睡眠的区别(整理)
- 方维带货直播最新教程原创文档-申请腾讯云密钥
- U盘在windows电脑中毒,插入Macbook变成exe文件
- 动词ing形式的5种用法_动词ing形式的用法及变化规则 | 学思外教
- linkedin python 领英技能 测评
- 要重复多少次变成潜意识_一种行为,多次重复后就能进入人的潜意识
- 【MyBatis】框架-----MyBatis的基础知识以及案例分析