PM2.5数据的清洗,汇总与制作散点图(含源数据链接)
相关数据:
北京空气质量(2012-2018年)
点击打开链接
全国空气质量历史数据 | 北京市空气质量历史数据(每周更新)
点击打开链接
# -*- coding: UTF-8 -*-
import pandas as pd
import datetime
import csvdef writer_data_extra(date,type,mean):csvfile = open('.\\beijing_20180101-20180324/aqi1.csv', 'a', newline='')writer = csv.writer(csvfile)info = [date,type,mean]writer.writerow(info)csvfile.close()def run_extra():begin = datetime.date(2018,1,1)end = datetime.date(2018,3,24)d = begindelta = datetime.timedelta(days=1)q = 0while d <= end:num = d.strftime('%m%d')filename = pd.read_csv('./beijing_20180101-20180324/beijing_extra_2018' + num + '.csv')for j in range(0, 8, 2):nf = filename[j::8]#奇数的语句print x[::2]#偶数的语句print x[1::2]for i in nf.columns[3:]:a = nf[str(i)].median()nf.fillna(a, inplace=True)date = list(set(nf['date']))[0]type = list(set(nf['type']))[0]sum = 0for i in nf.columns[3:]:b = nf[str(i)].mean()sum += bmean = round(sum / len(nf.columns[3:]), 1)# print('date:{} type:{} val:{}'.format(date, type, mean))writer_data_extra(date, type, mean)q += 1if q % 10 == 0:print("正在转录...")d += deltaprint("**********转录完毕**************")if __name__ == '__main__':run_extra()
程序:将两个表根据相同项(date)合并
import pandas as pd
import csvdef writer_data_all(date,type,val):csvfile = open('.\\beijing_20180101-20180324/aqi_all.csv', 'a', newline='')writer = csv.writer(csvfile)# writer.writerow(('date', 'type', 'val'))info = [date,type,val]writer.writerow(info)csvfile.close()def main():filename1 = pd.read_csv('./beijing_20180101-20180324/aqi1.csv')filename2 = pd.read_csv('./beijing_20180101-20180324/aqi2.csv')fn3 = pd.concat([filename1,filename2])fn4= fn3.sort_values(by='date',ascending=True).reset_index(drop=True)print(fn4.T)if __name__ == '__main__':main()
程序:制作散点图
import pandas as pd
import matplotlib.pyplot as pltdef main():df = pd.read_csv('./data.csv')list = ['NO2', 'SO2', 'O3', 'CO', 'PM10', 'AQI']for i in list:item = df[i]PM2_5 = df['PM2.5']plt.scatter(item,PM2_5)plt.title(i + ' And PM2.5')plt.xlabel(i)plt.ylabel('PM2.5')plt.savefig('./'+ i + 'AndPM2.5.png')plt.show()if __name__ == '__main__':main()
效果:
PM2.5数据的清洗,汇总与制作散点图(含源数据链接)相关推荐
- python问题中国五城市pm2.5_数据之路- 中国五城市PM2.5数据解读
PM2.5大家一定都不会陌生,特别是在北京生活的小伙伴们.PM2.5是指大气颗粒物(PM),其直径小于或等于2.5微米.在环境科学中,特指悬浮在空气中的固体颗粒或液滴,是空气污染的主要来源之一. 本文 ...
- 数据透视表汇总行在顶部显示_在数据透视表中比较顶部和底部销售
数据透视表汇总行在顶部显示 An Excel pivot table is a great way to summarize a large amount of data, and with its ...
- 全在这了!全国分省90米、30米、12.5米、5米DEM高程模型数据下载方式汇总
全在这了!全国分省90米.30米.12.5米.5米DEM高程模型数据下载方式汇总 SRTM15(450米)免费下载 https://pan.baidu.com/s/1eO0U6wfzs7YSe2EQd ...
- 2021年全网最详细大数据常见端口汇总❤️【建议收藏】❤️
目录 大数据常见端口汇总 一.Hadoop 二.Zookeeper 三.Hbase 四.Hive 五.Spark 六.Kafka 七.Flink 八.Flume 九.Redis 十.CDH 十一.HU ...
- 二、深度学习数据增强方法汇总
深度学习模型训练数据增强方法汇总 一.随机裁剪 二.RGB-->BGR通道互换 三.仿射变换(缩放) 三.随机旋转 四.对比度调整 五.随机抠图 六.bound box 中心点随机抠图 七.随机 ...
- 从零开始,手把手教会你5分钟用SPARK对PM2.5数据进行分析(包括环境准备和SPARK代码)...
2019独角兽企业重金招聘Python工程师标准>>> 要从零开始,五分钟做完一个基于SPARK的PM2.5分析项目,你是不是会问 1. PM2.5的数据在哪里? 2. SPARK的 ...
- 利用SQL对数据进行清洗处理
获取数据后,对数据的清洗工作必不可少,常用的数据清洗方法主要有缺失值填充.数值替换.数据类型转换.数据分列.重复值处理等,清洗的数据结果直接影响最后数据分析的结果,一个成熟的数据分析师,在日常工作中绝 ...
- 大数据人工智能物联网论文_物联网学报“大数据”相关论文汇总
戳上面的蓝字关注我们哦! <物联网学报>"大数据"相关论文汇总 (点击题目即可跳转至指定论文) [1]龚淑蕾, 李堃, 童恩, 等. 基于蜂窝工业物联网的智能工厂解决 ...
- 使用Echarts制作散点图(Excel导入数据方式)
2019独角兽企业重金招聘Python工程师标准>>> Echarts相当于一款JS插件,可以制作出绚丽多彩的图表,其支持制作的图表类型和可以使用的样式都非常丰富.本文以Echart ...
- Python Pandas 列数据筛选方法汇总
Pandas 列数据筛选方法汇总 数据准备: 一.筛选得到指定的列 1.1 根据 label 选择特定的几列 1.2 选择单列的两种方式 1.3 通过正则表达式选择列 二.同时对 行 和 列 进行筛选 ...
最新文章
- iphone4 电话截获
- git flow 使用步骤
- THOR:MindSpore 自研高阶优化器源码分析和实践应用
- leetcode刷题:求旋转有序数组的最小值
- 翻译连载 | JavaScript轻量级函数式编程-第5章:减少副作用 |《你不知道的JS》姊妹篇...
- ERROR: This version of Android Studio cannot open this project, please retry with Android Studio 3.
- Linux标准化:避免重蹈UNIX的覆辙
- 光立方体c语言程序,444光立方程序怎么写 光立方原理图、源代码及制作教程 - 全文...
- 声网3D空间音频技术解析:3D空间音效+空气衰减模拟+人声模糊
- 学计算机选择师范类好吗,师范教育类专业和计算机类专业,两者相比,哪个更适合自考生报读...
- 关于举办“2020·中国边缘计算企业20强”榜单评选通知
- DaDa英语怎么样,给孩子报名哒哒英语上课好不好?
- 阿里钉钉、蚂蚁、饿了么,淘宝真实面试分享
- windows服务器无法安装net3.5 提示:无法通过windows功能控制面板自动安装或卸载windows server角色和功能服务器
- 0基础自学软件测试的渠道你知道哪些?
- 关于Mac版Mysql的my.cnf配置文件
- 强大的代码编档工具—Doxygen
- 计算机名改了怎么恢复,手把手练习win10系统改计算机名和工作组的恢复技巧
- 科研必备工具篇(持续更新)
- 基于顺序表的图书管理系统(C语言)