GeoDa空间自相关操作步骤

  • 前言
    • GeoDa软件与下载
    • 目标
    • 理解空间自相关
  • Geoda空间自相关计算步骤

练习数据获取
关注cshgiser公众号,回复“路网密度”获取~

前言

GeoDa软件与下载

GeoDaGeoDa是一个免费的开源软件工具,是进行空间数据分析的强有力软件,最具特色的应该是空间自相关的计算,除此之外,软件本身集成了很多空间数据探索分析方法。

目标

逐步利用Geoda计算莫兰指数

理解空间自相关

依据“越相近,越相似”的原理(地理学第一定律),空间现象普遍存在自相关性。

以GDP为例,一个地区的GDP高,它周围的区域很难完全独立于该区域,可能存在下面两种情况:

(1)它周围区域的GDP都很高(正相关),可能是共享了某个有利的客观条件,如沿海区域GDP都倾向于较高。

(2)它周围的区域GDP都很低(负相关),假设该区域具有很强的城市吸引力,将资源从周边区域吸收出去,则会造成这种局势。

无论哪种情况,区域上的相近会造成某种属性相似,这就是空间自相关。为了度量空间自相关,Moran在1984年提出一个指数来反映空间邻接或空间邻近的区域单元属性值的相似程度。

莫兰指数I的定义式如下:

可以不用懂上面这个式子,只需要知道它需要输入什么数据,得到什么结果。

结果比较简单:和相关系数一样,值域为-1~1,越接近于-1,负相关性越大;越接近于1,正相关性越大。

然后看一下它需要什么输入:也比较简单,由于是“自相关”,只需要输入一个变量。另外就是如何体现“空间”,其核心是空间权重矩阵的确定。

空间权重矩阵以0或1的方式标记两者是否邻接,来体现空间关系,确定邻接方式有两种。

第一种为多边形邻接(如处理的数据为面状要素):定义两个要素有公共线为相邻,定义权重为1,或者两个要素二阶相邻(相邻的相邻)。

第二种为距离邻接(如处理的数据为点状要素):即在一定距离范围内相邻,这个距离可以是简单的欧氏距离也可以是复杂的线段距离(基于路网等等)。

一个熟练的应用者应在定义权重矩阵上下功夫,懂的权重矩阵的含义,从实际问题出发,基于一定假设,构建合适的权重矩阵。后续的结果分析中,同样需要了解所定义的权重。至于其他,则可以无脑输入。

虽然莫兰指数能够判断出空间上的整体分布情况,但事实难以探测出聚集的位置所在及区域相关程度。为了反映整个大区域中的局部指标,需要进一步分析局部空间自相关。通常包括:空间联系的局部指标(Local Indicators of Spatial Association,LISA)Moran散点图

局部莫兰指数定义如下:

同样不需要懂上面这个式子,只要理解通过上面这个式子可以计算得到每个要素对应的局部莫兰指数值,同时经过显著性检验可以知道哪些是结果是显著的。由此生成一个空间分布图(LISA图)呈现出不同的聚集特征。

莫兰散点图是Anselin在1996年首次提出的,所拟合的回归直线的斜率即为莫兰指数。

如图为一个莫兰散点图,散点图的横轴为变量的值与均值的偏差,纵轴为邻居要素的变量的值与均值的偏差。可能理解起来比较抽象,可以直接看结论:

与局部莫兰指数相比,莫兰散点图的重要优势在于能够进一步具体区分每个要素与其邻居要素之间的关系,包括高值-高值(落在第一象限)低值-低值(落在第三象限)、**高值-低值(落在第四象限)低值-高值(落在第二象限)**四种空间联系形式。这样能够更清晰的知道,一个区域周围分布的是高值区域和低值区域,这在实际问题的分析中具有重要参考价值。

Geoda空间自相关计算步骤

1.首先加载数据,打开看一下属性表:

2. 构建权重矩阵。点击Create Weights按钮就可以进入权重构建页面,如下图所示:

这里有几个选项,可以根据需求选择:

(1)Weights File ID Variable:变量标识,是属性表中的某一列,用于标识对象,所以需要值唯一。当然也可以点击Add ID Variable 创建新的标识列。

(2)确定权重邻接形式。第一种为多边形邻接确定权重(a);第二种为距离邻接确定权重(b)。这两种方法选择其中一个。

(a)多边形邻接确定权重参数设置

Rook contiguity和Queen contiguity,这两个参数点选其一。

rook和queen国际象棋术语。rook, 横、竖均可以走,步数不受限制,不能斜走(和中国象棋类似),不能越子。queen, 横、直、斜都可以走,步数不受限制,但是,不能越子行棋。该棋也是棋力最强的棋子。差别看上图就清楚了。

Order of contiguity,该参数定义几阶邻接,默认就是一阶。两阶邻接就是一个多边形邻接的邻接也在距离之内,依此类推。

(b)距离邻接确定权重参数设置。

Threshold distance为距离阈值,超出阈值判别为不邻接。

Distance metric距离度量方式,包括欧几里得距离(Euclidean distance,直线距离),输入两个坐标就能算出;弧段距离(Arc distance),主要针对没有投影,如用经纬度的图层,这类图层不能用经纬度坐标直接计算欧氏距离,因此引入考虑地球曲率的弧段距离。不过,还是建议在做与距离有关的分析时,首先对图层进行投影。

X-coordinate variable和Y-coordinate variable为坐标变量,就是每个要素的实际位置,如果是多边形一般取的就是质心坐标了。

这里以多边形rook邻接方式构建权重矩阵,构建好的权重矩阵文件,用写字板打开如下:

虽然是权重矩阵文件,但是并没有以矩阵的形式存储,因为存储大量的0和1会占据大量内存空间。这个文件以两行为一个单元存储了每个元素的邻居元素,例如可以看出27077这个对象有3个邻接,分别为27007,20135和27071。

3. 计算全剧莫兰指数。点击Univariate Moran’s I 进入莫兰指数计算界面,首先是确定变量。

我们这里以UE90这个变量为例,含义为1990的失业率。

计算得到莫兰指数为0.543.

理解散点图:这里引入一个变量z,含义为变量UE90偏离均值的大小,所以整体上分布在0值两边。同是z也就是横轴变量,而纵轴变量为邻接要素的变量值乘以对应归一化权重值的和,反映的是邻居要素的整体水平。由此可见,落在第一象限,无论是该元素还是它的邻居元素,UE90均比较大(相对均值来说),体现一种高-高分布的格局;而第二象限内,该元素UE90比较小,它的邻居元素变量值又比较大,呈现一种低-高的空间分布格局。

这个散点图为莫兰散点图,是Anselin在1996年首次提出的,所拟合的回归直线的斜率即为莫兰指数。

4. 显著性评估

通过随机生成空间数据,来看是否能够拒绝空间随机性的零假设,由上图可以看出,黄色的线(I=0.543)较远地落在特定P值下随机分布的右侧,表明该统计结果比较显著。

5. 计算局部莫兰指数。点击univariate Local Moran’s I 进入局部莫兰指数计算界面,首先是确定变量。

仍以UE90这个变量为例。

在执行局部莫兰指数计算时,可以勾选三个显示结果,分别为显著性图、聚集分布图和莫兰散点图,实际上莫兰散点图在计算全局空间自相关时已经显示,这里勾选前两个选项。

这两个图,上面为聚集图,有四种空间联系方式,包括高值-高值(莫兰散点图中落在第一象限的区域)、低值-低值(第三象限)、高值-低值(第四象限)和低值-高值(第二象限)。同时该聚集图只显示了显著的区域。

下面为对应的显著性水平,表明每个区域对应的局部相关值是否显著。

GeoDa 空间自相关操作步骤相关推荐

  1. geoda空间自相关分析_【方法笔记4】Geoda空间计量1 空间自相关

    以黑龙江省为例: 1.导入shp格式地图:打开目标地图,点击第二行第4个数据按钮可以查看地图数据变量 2.数据合并:即将研究的各地级市数据与导入地图"捆绑",首先找到地图数据中可以 ...

  2. Oracle删除用户以及表空间的操作步骤

    首先是出于测试需要,之前搭建的测试环境现在访问的时候无法访问,无法完成测试,所以需要检查一下. 在Oracle当中导入dmp文件时候显示在Oracle中导入失败,出现了图中所示的错误.根据网上的经验借 ...

  3. 【Pytorch神经网络理论篇】 26 基于空间域的图卷积GCNs(ConvGNNs):定点域+谱域+图卷积的操作步骤

    图卷积网络(Graph Convolutional Network,GCN)是一种能对图数据进行深度学习的方法.图卷积中的"图"是指数学(图论)中用顶点和边建立的有相关联系的拓扑图 ...

  4. qq浏览器私密空间在哪 具体操作步骤

    想要找到私密空间时,首先打开手机上的QQ浏览器 qq浏览器私密空间在哪 具体操作步骤 打开qq浏览器首页后点击"文件"菜单,位置见下图 qq浏览器私密空间在哪 具体操作步骤 打开& ...

  5. 空间地理加权回归stata_xy妙妙屋丨地理加权回归和空间自相关

    关于地理加权回归和空间自相关 菜鸡的我只是大神文章的搬运工orz,本意是想搞清楚双变量局部空间自相关和地理加权回归的区别,虽然依旧一知半解,但是,害.(下面网址我不会搞超链接,我发现有点麻烦,所以我懒 ...

  6. 空间自相关及其SAM软件使用

    空间自相关是指一些变量在同一个分布区内的观测数据之间潜在的相互依赖性,如生物多样性指数较高只是因为周边的值较高影响所致,所以要尽量避免这一效应,虽然最近有文章探讨排除与否好像不是很大-- 言归正传,排 ...

  7. y空间兑换代码_动态空间面板模型教程(一文读懂动态面板空间spregdpd操作应用)...

    1 动态空间面板模型命令spregdpd 动态空间面板模型命令为spregdpd,语法格式为: spregdpd depvar indepvars [weight] , nc(#) wmfile(we ...

  8. 全局莫兰指数_空间自相关 | 莫兰指数

    空间自相关:是指一些变量在同一个分布区内的观测数据之间潜在的相互依赖性.其中,自相关中的"自"表示当你进行相关性观察统计量,是来源于不同对象的同一属性.Tobler(1970)曾指 ...

  9. 关于Ubuntu 16.04系统挂载硬盘以及迁移MYSQL数据存储目录的操作步骤

    转载链接 : 关于Ubuntu 16.04系统挂载硬盘以及迁移MYSQL数据存储目录的操作步骤 :https://www.jianshu.com/p/58093888ee25 本文背景: 现有项目系统 ...

  10. 双变量空间自相关_空间计量经济学的发展及其应用,经济模型总会需要

    为处理数据的空间相关性和空间异质性而发展的空间计量经济学, 已成为空间数据的标准分析工具, 并开始进入计量经济学的主流.从最初的探索性空间数据分析, 空间计量经济学发展到横截面数据空间计量模型, 进一 ...

最新文章

  1. ORACLE告警日志
  2. ML.NET 示例:对象检测-ASP.NET Core Web和WPF桌面示例
  3. Educational Codeforces Round 119 (Rated for Div. 2)
  4. 原来访问网页弹出cookie是这样的
  5. 浅析haartraining方法进行人脸检测
  6. (计算机组成原理)第二章数据的表示和运算-第四节1:算数逻辑单元和电路基本知识以及基本逻辑运算和全加器还有串行、并行加法器
  7. hadoop3.1集成tez和tez-ui
  8. tp框架操作mysql_Thinkphp框架对数据库的操作(总结)
  9. Boost-IO学习 异步数据处理Simple(转)
  10. Oracle数据库编程:PL/SQL编程基础
  11. Atitit 项目质量管理 目录 1. 标准化 规范化 1 1.1. 而项目管理中的39个标准过程(PMI)或42个要素(ICB)全部是一次性过程或要素, 1 1.2. 休哈特(shewhart 统
  12. RayData大数据可视化教程(1)——软件使用和材质渲染基础
  13. 《近匠》专访WRTnode创始人罗未——开源硬件如何拥抱物联网
  14. linux添加凤凰引导,凤凰系统率先升级内核到Linux4.9
  15. Nginx日志管理——了解Nginx日志选项配置以及自定义日志格式使用
  16. linux查看硬盘vid,在linux获取并打印usb移动硬盘vid和pid
  17. 解决Nokia PC SUITE无法识别DELL E6400 WIDCOMM bluetooth的问题
  18. Python各版本安装包下载
  19. 浙里办开发票据认证单点登陆、令牌获取用户信息
  20. 什么是DPTR寄存器

热门文章

  1. php sjis,【通译】PHP中文字编码变换时使用SJIS-win而非SJIS,使用eucJP-win而非EUC-JP...
  2. 已知三点求这三点构成三角形的外接圆圆心坐标
  3. windows配置cmder
  4. 智能算法——遗传算法原理、应用汇总
  5. 释放QQ占用的C盘空间
  6. Windows内核文件
  7. 最近华为笔试题(9.8)第三题
  8. 如何破解WP7并安装xap文件
  9. 主流Ajax框架介绍
  10. sqlserver内存释放心得