地理加权回归分析完成之后,与OLS不同的是会默认生成一张可视化图,像下面这张一样的:

这种图里面数值和颜色,主要是系数的标准误差。主要用来衡量每个系数估计值的可靠性。标准误差与实际系数值相比较小时,这些估计值的可信度会更高。较大标准误差可能表示局部多重共线性存在问题。根据官方的说法,需要检查超过2.5倍标准差的地方……这些地方可能会有问题。

虽然在软件里面,默认只显示这样一张图,但是整个GWR分析完成之后,会生成大量的数据,今天我们就来看看ArcGIS的GWR工具的结果生成的哪些结果代表了什么东西。

首先,工具运行完成之后,会生成一张辅助表 (以_supp为后缀的) ,里面会有如下信息:

下面简单对这些指标进行一下解释:

Bandwidth 或 Neighbors:
模型中,用于各个局部估计的带宽或相邻点数目的值(看你选择的是可变还是固定,如果是可变,就是带宽,固定,就是相邻点的数目),以前一而再再而三的强调过,核估计中,核函数对结果的影响很小,但是带宽对结果影响很大,所以这个参数是“地理加权回归”的最重要参数。它控制模型中的平滑程度。

这里用山东省的数据,采用AICc模型估计的带宽,因为数据用的投影坐标系,单位是米,所以这里的160536表示160公里左右。那么我们来看看,160公里的带宽,在以山东为研究区域的范围内,覆盖多大的范围:
以淄博市沂源县的中心点,进行160公里的估算,结果如下:

差不多能够包括三分之一个山东省吧,当然,我这里的这个距离是通过AICc方法估算出来的,代表了在某种最优的带宽。关于AICc或者CV模型的原理,可以参考以前的文章:

白话空间统计二十四:地理加权回归(五)

这里需要注意的时候,当你选择不同的方法的时候,得出来的所谓“最优”距离都是不一样的。

当然,如果你在设置分析参数的时候,也可以选择固定距离或者固定临近点的数目,这里就会出现你参数里面设置的值了。

ResidualSquares

指模型中的残差平方和(残差为观测所得 y 值与 GWR 模型所返回的 y 值估计值之间的差值)。此测量值越小,GWR 模型越拟合观测数据。此值还在其他多个诊断测量值中使用。

EffectiveNumber
这个值与带宽的选择有关。是拟合值的方差与系数估计值的偏差之间的折衷表示。好吧,这个说法有些拗口。下面简单来解释一下这个东东是干嘛的。

首先,地理加权回归很倚赖于带宽(或者说,依赖于临近要素),那么如果我的带宽无穷大的时候,整个分析区域里面的要素都变成了我的临近要素,这样地理加权就没有意义了,变成了全局回归也就是OLS……这样,每个系数的估计值就变成OLS的估计值。

那么对于大的带宽来说,所有的要素都被包含进回归方程里面,那么回归方程系数的有效数量接近实际的数量(地理加权的权重都是1)。而对于局部来说,它的估计值就具有相对较小的方差(局部和全局差不多,值散布范围很小),但是偏差就大了(异质性何在……)

但是如果我的带宽无限接近0的时候,除要素本身以外,旁边所有的临近要素的权重都是0,这样回归方程的有效系数就变成了回归点本身(只有观测点一个有效系数)。那么局部系数估计值将具有较大方差但偏差较低。(所有的观察点,都有独立的表现,所有要素都具有独立性,完全体现异质性)。

这两种情况,正好是两个极端,都不是我们希望的,那么,我们就需要在中间找到一个平衡点。EffectiveNumber这个值,就是用于衡量这个平衡点的数值。这个数值主要用于诊断不同的模型中使用。

Sigma
西格玛值为标准化剩余平方和(剩余平方和除以残差的有效自由度)的平方根。它是残差的估计标准差。此统计值越小越好。主要用于 AICc 计算。

AICc(关于赤则的信息,查看上面给出的白话空间统计二十四:地理加权回归(五))
AICc是模型性能的一种度量,有助于比较不同的回归模型。考虑到模型复杂性,具有较低 AICc 值的模型将更好地拟合观测数据。AICc不是拟合度的绝对度量,但对于比较适用于同一因变量且具有不同解释变量的模型非常有用。

如果两个模型的AICc值相差大于3,具有较低AICc值的模型将被视为更佳的模型。

在很多论文里面,将GWR的AICc值与OLS的AICc值进行比较,然后根据AICc的值,得出局部回归模型(GWR)比全局模型(OLS)具有更大的优势。(而不是单纯的通过比较拟合度或者性能)。

R2:R 平方是拟合度的一种度量。其值在 0.0 到 1.0 范围内变化,值越大越好。此值可解释为回归模型所涵盖的因变量方差的比例。R2 计算的分母为因变量值平方和。所以增加一个解释变量的时候,分母不变,但是分子发生改变,这就有可能出现拟合度上升的情况(大部分都是假象),所以这个值仅作为参考,更准确的度量,大多数用下面的校正R平方。

R2Adjusted:由于上述 R2 值问题,校正的 R 平方值的计算将按分子和分母的自由度对它们进行正规化。这具有对模型中变量数进行补偿的效果,因此校正的 R2 值通常小于 R2 值。但是,执行此校正时,无法将该值的解释作为所解释方差的比例。

在 GWR中,自由度的有效值是带宽的函数,因此与像OLS之类的全局模型相比,校正程度可能非常明显。因此,AICc是对模型进行比较的首选方式。

然后后面就是你的因变量和自变量了……这个不用解释。

待续未完。

白话空间统计二十四:地理加权回归(八)结果解读(一)相关推荐

  1. 白话空间统计二十四:地理加权回归(九)结果解读(二)

    实际上,除了辅助表以外,GWR还会生成一份全要素的表.对回归的每一个样本都给出相应的信息,今天就来看看这些信息代表了什么内容. 生成的新的要素类字段信息如下: 实际上,Coeffcient(系数)和S ...

  2. 白话空间统计二十九:空间插值(二)

    前文再续,书接上一回--上回书说到,空间插值可以对数据进行估算,这一张我们来具体说说空间插值的一些概念. 首先,来说说插值的输入与输出问题. 首先输入的肯定是用来进行插值的观测点数据,一般来说都是点要 ...

  3. 白话空间统计二十九:空间插值(六)IDW部分完结篇

    写在前面的话: 我知道很多同学都在等克里金,但是空间插值这个系列我已经预定好了撰写的思路,所以暂时没办法直接跳过前面的内容直奔克里金,所以大家只能将就一下先把前面的内容看完,但是应该快了. 前文再续, ...

  4. 白话空间统计二十三:回归分析(四)

    白话空间统计二十三:回归分析(四) 今天把回归最后几个概念介绍一下,后面就不再说了--开始写回归的时候,我发现我掉入了一个巨大的坑里面.就说回归分析这种东东,汗牛充栋啊,在任何大学里面,妥妥一个学期的 ...

  5. 白话空间统计二十一:密度分析(五)带宽与核表面曲率的关系

    白话空间统计二十一:密度分析(五) 上次讲密度分析的时候,有同学问道带宽的问题,实际上我翻 了一下以前写的文章,在密度分析一.二里面,都对这个有过描述,详细的可以回去翻一下(很老的文章了--可能要翻到 ...

  6. 白话空间统计二十一:密度分析(一)

    白话空间统计二十一:密度分析(一) 密度分析这个概念其实很早就想写了,也有无数同学都问过我,虾神你能不能讲讲那些漂亮的热度图是怎么做的啊?比如下面这种: 如果说,这是互联网地图里面,最让人喜闻乐见的一 ...

  7. 白话空间统计二十一:密度分析(四)

    白话空间统计系列断了好久了--虽然写了很多其他的文章,但是有同学问,还是系列性的文章效果比较好,当然这些文章大部分都能分开来读,没有啥前后联系,但是系列文章最大的特点就是能够形成知识体系,无论是对于写 ...

  8. 白话空间统计二十七:统计学七支柱之空间统计版本(二)聚合(2)

    还记得a long long time ago 的青葱岁月--作为学渣的虾神最怕的就是各种(不擅长)的考试,虾神读书时候有个习惯,就拿到试卷之后,第一时间会把试卷翻到最后一页,去看最后一道大题.然后以 ...

  9. 白话空间统计二十三:回归分析番外-ArcGIS中的OLS(一)

    在讲GWR的ArcGIS应用之前,首先讲讲ArcGIS里面的OLS(Ordinary least squares:普通最小二乘法)工具的应用和解读,毕竟GWR是从回归分析里面演化出来的,OLS又是回顾 ...

最新文章

  1. ZendStudio导入一个已有的网站
  2. qt练习7 定时爆炸小游戏
  3. Java 类加载总结
  4. mysql 高版本检索外键_第05期:外键到底能不能用?
  5. 诗与远方:无题(二十九)
  6. 2017.9.17 相关分析 思考记录
  7. 拼多多回应“轩尼诗假酒”案:实际售出3单 9月已关闭店铺
  8. 知识图谱组队学习Task04——知识库的查询语句
  9. Linuxqt制作文本编辑器_Python实操!速收藏!学习使用Python创建文本编辑器应用程序
  10. 【学堂在线数据挖掘:理论方法笔记】第l六天(3.31)
  11. 360 RePlugin 初探
  12. 2018服务器cpu性能天梯图,哪里看CPU性能排行榜?2018年CPU天梯图最新版(高清)...
  13. 【高颜值的盲打练习网站】彻底摆脱二指禅,刻意练习一星期后打字速度可提升20wpm!!!
  14. AMIRA时间预测实现过程详解(含代码可直接套用)
  15. 使用Sivarc使PLC程序标准化
  16. python爬虫之爬取捞月狗直播信息
  17. 多层神经网络 ——小批量梯度下降法
  18. 有时间要看的书(个人整理)
  19. 小学英语阅读促进学生思维品质发展及其策略应用的综述
  20. 索引(从零开始)必须大于或等于零且小于参数列表的大小

热门文章

  1. EN 1096-4: 建筑玻璃.涂层玻璃.第4部分:产品标准
  2. 对信念的理解正确的是_信念-伴随着你的向阳花
  3. Python爬虫:爬去韩国电视剧信息
  4. 招聘软件开发工程师---华为三康技术有限公司
  5. Volley网络框架分享
  6. 【MATLAB】椭圆检测(Ellipse Detection)算法(含代码)
  7. 百度热力图颜色说明_最新鳌江流域人口热力图
  8. 网络安全协议分析-wireshark流量监控(未完)
  9. 摘自《读者》的哲理短句——爱情篇
  10. 给go生成的windows exe文件添加icon图标