下表给出了2017年全国113个环保重点城市空气质量年度数据(资料来源:中华人们共和国国家统计局)。它们分别为:二氧化硫平均浓度(微克每立方米,),二氧化氮平均浓度(微克每立方米,);可吸入颗粒物(PM10)年平均浓度(微克每立方米,);一氧化氮日均值第95百分位浓度(毫克每立方米,);臭氧(O3)日最大八小时第90百分位浓度(微克每立方米,);细颗粒物(PM2.5)年平均浓度(微克每立方米,);空气质量达到极好于二级的天数(天,)。

表格过长,这里只显示部分

K均值聚类法是一种快速动态聚类方法,它改进了系统聚类每一步都要计算类间距离,计算比较浪费时间的缺点。其基本思想是,根据给定的参数k,先把n个对象粗略的分为k类,然后按照某种最优准则(通常为一个准则函数)修改不合理的分类,知道准则函数收敛为止,就得到了一个最终的分类结果。

下面根据这个数据对这113个城市进行K均值聚类分析(我们设置聚类数为4) ,R程序如下:

ex4.3<-read.csv("ex4.3.csv",header = T)
d4.3=ex4.3[,-1] #ex4.3.csv的第一列为城市名称,先去掉
rownames(d4.3)=ex4.3[,1] #用ex4.3的第一列为d4.3的行重新命名
KM<-kmeans(d4.3,4,nstart = 20,algorithm = "Hartigan-Wong") #聚类个数为4#初始随机集合个数为20,算法为"Hartigan-Wong"默认#其他备选算法为"Lloyd","Forgy","MacQueen"
KM

运行结果如下:

其中,size表示各类的个数,113个城市被聚成大小为38、28、22、25的四个类;means表示各类的均值,Clustering vector表示按照地区原顺序聚类后的分类情况及类间平方和在总平方和的占比(这里为85.1%,越大越好)。

对分类结果进行排序并且查看分类情况:

按照排序后的分类结果,113个地区被分为四类:

第一类:秦皇岛     大同     包头     大连     鞍山     抚顺     长春     吉林   哈尔滨     上海     南京

苏州     南通   连云港     杭州     宁波     绍兴     南昌     九江     青岛     烟台     日照   武汉     宜昌   荆州     长沙     株洲     湘潭     岳阳     常德     广州     重庆     泸州   绵阳     南充     宜宾     延安   西宁

第二类:石家庄     唐山     邯郸     保定     太原     阳泉   长治     临汾     徐州     济南     淄博     枣庄     泰安     郑州     开封     洛阳   平顶山 安阳     焦作     西安     咸阳     渭南

第三类: 北京     天津 呼和浩特     沈阳     锦州     无锡   常州     扬州     镇江     湖州     合肥     芜湖   马鞍山     潍坊     济宁   三门峡     成都  自贡     德阳     铜川     宝鸡     兰州     银川   石嘴山 乌鲁木齐

第四类:赤峰     本溪 齐齐哈尔  牡丹江     温州     福州     厦门     泉州   张家界     韶关     深圳     珠海     汕头     湛江  南宁     柳州     桂林     北海     海口   攀枝花     贵阳     遵义     昆明     曲靖   玉溪   拉萨     金昌 克拉玛依

附录

ex4.3<-read.csv("ex4.3.csv",header = T)
d4.3=ex4.3[,-1] #ex4.3.csv的第一列为城市名称,先去掉
rownames(d4.3)=ex4.3[,1] #用ex4.3的第一列为d4.3的行重新命名
KM<-kmeans(d4.3,4,nstart = 20,algorithm = "Hartigan-Wong") #聚类个数为4#初始随机集合个数为20,算法为"Hartigan-Wong"默认#其他备选算法为"Lloyd","Forgy","MacQueen"
KM
sort(KM$cluster) #对分类结果进行排序并且查看分类情况

数据

 x1  x2  x3  x4  x5  x6  x7
北京  8   46  84  2.1 193 58  226
天津  16  50  94  2.8 192 62  209
石家庄 33  54  154 3.6 201 86  151
唐山  40  59  119 3.8 205 66  205
秦皇岛 26  49  82  2.9 170 44  268
邯郸  36  51  154 3.4 195 86  142
保定  29  50  135 3.6 218 84  159
太原  54  54  131 2.5 185 65  176
大同  44  32  73  3   154 36  301
阳泉  49  48  116 2.5 198 61  193
长治  43  41  103 3.1 188 60  195
临汾  79  37  122 4.1 214 79  128
呼和浩特    29  45  95  2.8 167 43  255
包头  28  42  93  2.7 159 44  277
赤峰  23  20  70  2.3 133 34  318
沈阳  37  40  85  1.9 166 50  256
大连  17  28  58  1.4 163 34  300
鞍山  30  36  85  2.4 158 48  263
抚顺  24  34  81  1.7 144 47  275
本溪  27  31  71  2.3 116 40  318
锦州  45  38  78  2   172 48  255
长春  26  40  78  1.9 142 46  276
吉林  18  29  79  1.8 147 52  259
哈尔滨 25  44  84  2   133 58  271
齐齐哈尔    22  22  65  1.5 112 38  319
牡丹江 10  26  65  1.3 105 36  329
上海  12  44  55  1.2 181 39  275
南京  16  47  76  1.5 179 40  264
无锡  13  46  77  1.6 184 44  247
徐州  22  44  119 1.7 187 66  176
常州  18  45  76  1.5 184 48  249
苏州  14  48  64  1.4 173 42  261
南通  21  38  64  1.4 179 39  266
连云港 18  33  73  1.5 153 45  289
扬州  18  40  93  1.4 192 54  228
镇江  15  43  88  1.2 182 55  232
杭州  11  45  72  1.3 173 45  271
宁波  10  38  60  1.1 158 37  311
温州  12  41  65  1   145 38  329
湖州  15  38  64  1.3 187 42  250
绍兴  12  35  70  1.2 170 45  275
合肥  12  52  80  1.4 170 56  224
芜湖  15  49  82  1.6 177 49  249
马鞍山 17  39  83  1.8 188 50  238
福州  6   29  51  0.9 141 27  349
厦门  11  32  48  0.8 117 27  362
泉州  12  28  53  0.9 148 28  345
南昌  15  37  76  1.6 148 41  300
九江  20  29  70  1.2 148 48  287
济南  25  48  128 2.1 193 65  181
青岛  15  38  78  1.3 166 39  283
淄博  41  47  120 2.8 194 65  188
枣庄  30  28  125 1.4 175 63  192
烟台  18  33  68  1.6 163 35  294
潍坊  25  35  116 1.8 186 59  210
济宁  26  41  106 1.9 200 56  217
泰安  25  39  97  1.9 213 58  197
日照  15  37  85  1.4 158 47  273
郑州  21  54  118 2.2 199 66  166
开封  20  39  103 2.2 182 62  188
洛阳  25  42  117 2.4 204 69  166
平顶山 24  40  106 2.1 180 63  185
安阳  31  50  132 4.1 210 79  154
焦作  25  44  125 3.1 208 73  168
三门峡 22  41  98  2.1 181 57  217
武汉  10  50  85  1.6 151 52  255
宜昌  12  35  88  1.7 137 58  258
荆州  18  36  92  1.7 140 56  273
长沙  13  40  69  1.3 153 52  262
株洲  19  36  81  1.4 142 52  272
湘潭  20  37  80  1.3 142 51  267
岳阳  14  25  70  1.4 142 49  305
常德  12  22  77  1.8 147 54  275
张家界 8   22  67  1.9 129 42  324
广州  12  52  56  1.2 162 35  294
韶关  17  29  52  1.4 152 38  326
深圳  8   30  45  1   147 28  343
珠海  7   32  43  1   160 30  322
汕头  12  21  49  1.1 140 29  353
湛江  10  15  42  1.1 153 29  327
南宁  11  35  56  1.4 119 35  337
柳州  19  26  66  1.5 127 45  308
桂林  15  25  60  1.3 139 44  308
北海  9   13  45  1.4 138 28  336
海口  6   12  37  0.8 127 20  352
重庆  12  46  72  1.4 163 45  277
成都  11  53  88  1.7 171 56  235
自贡  15  37  89  1.6 150 66  227
攀枝花 35  36  67  2.7 119 34  359
泸州  17  35  80  1   147 53  273
德阳  9   30  84  1.3 166 51  247
绵阳  9   32  71  1.4 134 48  295
南充  12  34  72  1.3 150 46  289
宜宾  18  34  80  1.7 146 57  261
贵阳  13  27  53  1.1 121 32  347
遵义  12  28  54  1.1 109 33  344
昆明  15  32  58  1.2 124 28  360
曲靖  18  23  54  1.4 126 28  357
玉溪  16  22  47  1.9 125 23  362
拉萨  8   23  54  1.1 128 20  361
西安  19  59  126 2.8 185 73  180
铜川  20  35  91  2.2 165 52  242
宝鸡  12  41  102 2.1 155 58  247
咸阳  21  54  132 2.4 201 79  154
渭南  18  56  129 2.3 183 70  165
延安  32  52  90  3   146 42  313
兰州  20  57  111 2.8 161 49  232
金昌  27  16  74  1   138 24  322
西宁  24  40  83  2.8 136 34  294
银川  48  42  106 2.5 169 48  232
石嘴山 55  32  97  2   162 43  243
乌鲁木齐    13  49  105 3.4 122 70  241
克拉玛依    8   23  69  1.6 131 34  318

全国113个城市空气质量的K均值聚类分析--基于R相关推荐

  1. 全国369个城市空气质量月度数据(2013-2021)

    1.数据来源:https://www.aqistudy.cn/historydata/ 2.时间跨度:2013-2021年 3.区域范围:全国369个城市 4.指标说明: 该数据指标包括:日期.AQI ...

  2. openlayer4加载echart3的地理位置scatter图-全国主要城市空气质量

    在github上下载了ol3-Echarts-master,原数据是加载echart的迁徙图,我对作者的类进行了改造,编写了一个类EchartLayer,加载饼图.代码如下: 说明:没有用到偏移量的计 ...

  3. 全国主要城市空气质量热点图

    from pyecharts import Geodata = [("海门", 9), ("鄂尔多斯", 12), ("招远", 12), ...

  4. 全国主要城市空气质量

    效果: 代码: <!DOCTYPE html> <head> <meta charset="utf-8"> <title>全国城市空 ...

  5. 全国城市空气质量实时发布平台数据抓取采集获取

    全国城市空气质量实时发布平台(https://air.cnemc.cn:18007/   原http://106.37.208.233:20035/)数据抓取采集获取,数据处理方法 import or ...

  6. Python爬取国家数据中心环境数据(全国城市空气质量小时报)并导入csv文件

    1.开发环境: python 3.5   + fiddler 4 (抓包工具)+ 火狐浏览器 + idea 2.分析要爬取的页面 2.1  首页  数据中心  点击 全国城市空气质量小时报   查看 ...

  7. 基于Python的2013-2018全国城市空气质量分析

    基于Python的2013-2018全国城市空气质量分析 项目摘要 本项目使用pandas/numpy工具包对557424条空气质量数据进行导入及清洗,并使用matplotlib/seaborn/py ...

  8. 全国城市空气质量查询,PM2.5查询

    一.接口介绍 提供全国城市空气质量实时数据,每小时更新.目前支持全国300+城市,可查询监测点数据.实时查询空气质量.小时粒度.实时给出空气质量AQI指数,并给出空气质量级别和首要污染物.广泛应用于交 ...

  9. 全国城市空气质量查询 PM2.5查询

    一.接口介绍 提供全国城市空气质量实时数据,每小时更新.目前支持全国300+城市,可查询监测点数据.实时查询空气质量.小时粒度.实时给出空气质量AQI指数,并给出空气质量级别和首要污染物. 二.功能体 ...

最新文章

  1. 排序算法总结之归并排序
  2. UVA 270 Lining Up
  3. 转Linux环境下段错误的产生原因及调试方法小结
  4. 多线程:AQS源码分析
  5. 前端_JavaScript_面向对象编程
  6. UIT创新科存储系统服务“500强”汽车名企
  7. 对 C++ 的忧虑?C++ 创始人警告:关于 C++ 的某些未来计划十分危险
  8. 快速修改数组的某个值_我用Python,3分钟快速实现,9种经典排序算法的可视化...
  9. 以新型数据治理构筑城市发展新引擎,中国电子和清华大学联合发布 《2021中国城市数据治理工程白皮书》
  10. highCharts图表入门简介
  11. 添加C1WPFChart快捷键
  12. 深入理解java虚拟机---JDK8-废弃永久代(PermGen)迎来元空间(Metaspace)(十二)
  13. 在VirtualBox中安装WindowsXP
  14. WebEx Recorder 录屏软件
  15. Unity学习笔记--无限地图(地图拼接)
  16. 项目实战-电商(网上书城)
  17. GSM模块通过服务器或GSM内部获取网络时间 网络授时
  18. 最基本财务基础知识,财务知识基础来源
  19. java之简易生成彩色二维码实践
  20. 启动Selenium报错:session not created……解决方案

热门文章

  1. Arduino Proteus仿真
  2. 自己动手制作安卓动态壁纸教程
  3. SRE_Google运维解密_笔记
  4. 计算机二级基础知识总览,2020年最新计算机二级考试题库资料大全!
  5. Linux内核学习笔记 - RCU机制总结
  6. amazon linux虚拟主机,如何在Amazon AWS上设置Linux服务器
  7. 程序数据集散地:数据库-----的解析
  8. Java初学者作业——使用eclipse简单的输出(打印)游戏菜单
  9. 关于获取上传图片的长和宽
  10. IDEA闪退提示:There is not enough memory to perform the requested operation..【已解决】直接有效