AQI(空气质量指数)分析与预测(一)

数据分析

哪些城市的空气质量较好/较差

#空气质量最好的几个城市
t = data['Ciyt','AQI'].sort_values('AQI') #根据AQI升序排列
diaplay(t.iloc[:10]) #空气质量最好的十个城市
plt.xticks(rotation=45) #X轴坐标名称倾斜45度
sns.barplot(x='City', y='AQI', data=t.iloc[:10])

#空气质量最差的十个城市
s = data['Ciyt','AQI'].sort_values('AQI',ascending=False) #降序排列
display(s.iloc[:10])
plt.xticks(rotation=45)
sns.barplot(x='City', y='AQI', data=s.iloc[:10])

全国城市的空气质量
城市空气质量等级统计
对于AQI,可以对空气质量进行等级划分,划分标准如下表所示:

AQI指数 等级 描述
0-50 一级
51-100 二级
101-150 三级 轻度污染
151-200 四级 中度污染
201-300 五级 重度污染
>300 六级 严重污染

根据该标准,我们来统计全国空气质量每个等级的数量

#编写函数,将AQI转换为对应的等级
def value_to_level(AQI):if AQI >= 0 and AQI <= 50:return '一级'if AQI >= 51 and AQI <= 100:return '二级'if AQI >= 101 and AQI <= 150:return '三级'if AQI >= 151 and AQI <= 200:return '四级'if AQI >= 201 and AQI <= 300:return '五级'else:return '六级'
level = data['AQI'].apply(value_to_level)
display(level.value_counts())
sns.countplot(x=level, order=['一级','二级','三级','四级','五级','六级'])


可见,我们城市的空气质量主要以一级(优)与二级(良)为主,三级(轻度污染)占一部分,更高污染的城市占少数。

空气质量指数分布

sns.scatterplot(x='Longitude', y='Latitude', hue='AQI', palette=plt.cm.RdYlGn_r, data=data)


从结果我们可以发现,从大致的地理位置上看,西部城市好于东部城市,南部城市好于北部城市。

临海城市是否空气质量优于内陆城市
数量统计

#统计临海城市与内陆城市的数量
display(data['Coastal'].value_counts())
sns.countplot(x='Coastal', data=data)

#散点分布
sns.stripplot(x='Coastal', y='AQI', data=data)

sns.swarmplot(x='Coastal', y='AQI', data=data)

#分组计算的空气质量的均值
display(data.groupby('Coastal')['AQI'].mean())
sns.barplot(x='Coastal', y='AQI', data=data)

在柱形图中,仅显示了内陆城市与临海城市空气质量指数(AQI)的均值对比,我们可以使用箱线图来显示更多信息。

sns.boxplot(x='Coastal', y='AQI', data=data)


也可以绘制小提琴图,除了能够展示箱线图的信息外,还能呈现出分布的密度。

sns.violinplot(x='Coastal', y='AQI', data=data)


差异检验
我们可以进行两样本t检验,来查看临海城市与内陆城市的均值差异是否显著。

from scipy import statscoastal = data[data['Coastal']=='是']['AQI']
inland = data[data['Coastal']=='否']['AQI']#进行方差齐性检验
stats.levene(coastal, inland)


当不确定两总体方差是否相等时,应先利用levene检验,检验两总体是否具有方差齐性。
p值远大于0.05,认为两总体具有方差齐性。
如果两总体不具有方差齐性,需要将equal_val参数设定为“False”。
需注意的情况:
如果两总体具有方差齐性,错将equal_var设为False,p值变大。
两总体方差不等时,若没有将equal_var参数设定为False,则函数会默认equal_var为True,这样会低估p值。

#进行两样本t检验
r = stats.ttest_ind(coastal, inland, equal_var=True) #因为p值远大于0.05,故equal_var设定为‘True’
print(r)#原假设:沿海城市AQI<=内陆城市AQI
#备择假设:沿海城市AQI>内陆城市AQI
#使用右侧单边检验
p = stats.t.sf(r.statistic, df=len(coastal)+len(inland)-2)
print(p)


通过两样本t检验可知,有超过99%的几率可以认为,沿海城市的空气质量好于内陆城市。

AQI(空气质量指数)分析与预测(二)相关推荐

  1. AQI(空气质量指数)分析与预测(三)

    空气质量主要受哪些因素影响 猜想一:人口密度是否会对空气质量造成影响 猜想二:绿化率是否会影响空气质量 绘制空气质量.人口密度.绿化率的散点图矩阵,观察是否有影响 sns.pairplot(data[ ...

  2. AQI(空气质量指数)分析与预测(四)

    对空气质量进行预测 我们可以通过对以往数据的分析,建立模型,然后将这种模式去应用于未知的数据,进而预测结果. 数据转换 因为对于模型来说,内部进行的都是数学运算,故在进行建模之前,我们需要将类别变量转 ...

  3. AQI空气质量分析与预测

    AQI分析与预测 背景信息 AQI全称是Air Quality Index,指空气质量指数,用来衡量空气清洁或者污染的程度,值越小,表示空气质量越好. 本文的分析目标 一.描述性统计 哪些城市的空气质 ...

  4. python空气质量分析与预测_AQI(空气质量指数)分析与预测(一)

    任务说明 期望能够运用数据分析的相关技术,对全国城市空气质量进行研究与分析,希望能够解决如下疑问: 哪些城市的空气质量较好/较差?[描述性统计分析] 空气质量在地理位置上,是否具有一定的规律?[描述性 ...

  5. 城市空气质量分析与预测

    城市空气质量分析与预测 一.AQI分析与预测 1.背景信息 2.任务说明 3.数据集描述 二.数据分析流程 基本流程 三.读取数据 1.导入相关的库 2.加载数据集 四.数据清洗 1.缺失值 1.1. ...

  6. python爬空气污染实时数据_python数据分析综合项目--空气质量指数分析

    项目背景 近年来,我国的环境问题比较严重,很多城市出现了雾霾天气,当然也有很多城市空气依旧清新,为了研究具体的空气环境城市分布,我们采用了假设检验以及线性回归的思想对AQI(空气质量指数)进行分析和预 ...

  7. python空气质量分析与预测_干货!如何用 Python+KNN 算法实现城市空气质量分析与预测?...

    原标题:干货!如何用 Python+KNN 算法实现城市空气质量分析与预测? 作者 | 李秋键 责编 | 伍杏玲 封图 | CSDN 付费下载自东方 IC 出品 | CSDN(ID:CSDNnews) ...

  8. Python案例—AQI 空气质量指数

    """作者:Z_Howe版本:1.0功能:计算空气质量指数(Air Quality Index)日期:2019/1/29 """def ca ...

  9. python空气质量分析与预测_python 空气质量AQI数据分析与预测 ---分析,相关系数矩阵...

    版权声明:本文为博主原创文章,遵循CC 4.0 by-sa版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/YmeBtc/article/details ...

最新文章

  1. docker教程之从一头雾水到不一头雾水(1)
  2. AI攻破高数核心,1秒内精确求解微分方程、不定积分,性能远超Matlab
  3. 电气论文:基于遗传算法加非线性规划的水火电力系统经济调度(有程序和数据)
  4. SAP Spartacus checkout页面的入口逻辑
  5. Android之调用系统分享
  6. 后缀的形容词_后缀:ing 名词、形容词或介词后缀
  7. a*算法matlab代码_MATLAB数学建模算法的代码模板大全
  8. 如何在DOS下用TCP/IP协议进行登录Windows 2K?
  9. 【转】契约测试的必要性
  10. yum mysql 无法启动失败_Linux下MySQL数据库yum升级后无法启动解决办法
  11. C++实现获取汉字拼音首字母
  12. 千兆网卡为什么慢_宽带300M,光猫是千兆的,电脑网卡和无线路由器都是千兆的。但是速度仍是100M。这是为什么?...
  13. linux之ab测试
  14. Studio One5中文电脑音乐制作宿主软件保卫萝卜
  15. 【二次元的CSS】—— 用 DIV + CSS3 画咸蛋超人(详解步骤)
  16. Windows fatal exception: code 0xe06d7363
  17. python爬虫,python学习,如何用python爬取视频资源
  18. 三火龙加身战无不胜 TES国际首秀告捷
  19. python 系统学习实例1.2 - 人民币与美元的转换
  20. 计算机专业名词(缩写、全称、中文全称)

热门文章

  1. jira配置邮箱踩坑,测试发信失败、或者测试发信通过,但创建问题后不发送邮件
  2. 2021年征兵没有高考成绩查询,2021年征兵政策新调整,三种情况无法通过政审,快看看是不是自己...
  3. Android_仿爱奇艺Loading效果
  4. Swift--调用系统导航Apple map
  5. 如何制作一个完美的全屏视频H5
  6. matlab如何画极零图,用MATLAB画零极点图.ppt
  7. poj3281 Dining (最大流)
  8. h2o.ai源码解析(1)—项目简介
  9. 高清网络视频监控系统中交换机的选择
  10. 名字解析/DNS服务