公众号原文

ArcGIS与地理加权回归GWR【一】https://mp.weixin.qq.com/s/fMPYxO3G7ff2192ZQICN-A

开个新坑啊,写一写关于地理加权回归基础的东西(深了我也不会啊),希望也能用通俗的语言来记录一下我以前学习空间统计过程中的理解。

1. 传统线性回归

不管你有没有系统学习过,对于线性回归,相信多少都有那么点了解。回归分析实质上就是研究一个或多个自变量X对一个因变量Y的影响关系情况,如研究各地房价影响因素。X1-Xn是n个自变量,β0-βn是未知参数,可以使用最小二乘法进行估计,即β0-βn的最小二乘估计(那个β尖符号)。当自变量为1个时,是一元线性回归,自变量为2个及以上时,称为多元线性回归。

我也不会去深入巴拉一堆我也不专业的数学问题,地理加权回归正是在线性回归的基础上扩展而来,所谓青出于蓝而胜于蓝,那地理加权回归比传统的线性回归蓝在哪啊

一般线性回归都是全局的,由于空间自相关(地理学第一定律)和空间异质性(地理学第二定律)的存在,传统的回归模型不适用于处理地理空间数据。而GWR是在多元线性回归的基础上将数据的地理位置引入到回归系数之中。

2. 全局和局部

然后说明一下”全局回归“”局部回归“

线性回归可分为全局回归和局部回归,全局回归假定估计系数在全局内是平稳的,回归系数并不随着空间位置的改变而改变,如多元线性回归模型。好比经常说我们疫情防控整体稳中向好(WinWinWin);局部回归认为回归系数是局部光滑的,在全局内回归系数是不同的,有多个值的,好比稳中向好中也有个别地方爆发。如地理加权回归。简单的理解如下图,左边就是全局,右边就是局部。

外地想起四川便是标志性的熊猫与火锅,但在各地市眼里都很有特色

3. 地理篇

来看看地理加权回归中的“地理”,地理位置,没错,地理学第二定律登场:空间异质性,地理现象的空间变化以及变化的差异性,即不可控的空间变化规律。

单纯的举个例子,房价。在一个城市影响房价的因素是多样的,比如在A处,因为紧邻CBD房子卖的贵,在B处的老破小因为旁边有个好学校卖的也贵,在C因为依山傍水环境好所以房子卖的还贵,所以在A处,紧邻CBD这个因素对房价解释度就很强,环境或者学校在A处反而没太有什么关系。

(可能会有人想到对房价产生影响的某些社会经济因素在一个区域的影响力是一样的或者变化非常小可以忽略不计,而某些因素又是变化,这就属于混合地理加权回归模型了,在此请不要想太多)。

因此,在实际问题研究中我们经常发现回归参数在不同地理位置上往往表现为不同,也就是说回归参数随地理位置变化,这时如果仍然采用全局空间回归模型(全局假设β是不会变得),得到的回归参数估计将是回归参数在整个研究区域内的平均值,如上所说某一个因素在ABC等不同的地理位置对房价的影响是不同的,假如采用全局空间回归模型,便忽略了数据的空间位置属性,只反映平均意义下因变量与自变量的相关关系,而不能有效反映回归关系的空间非平稳性的特征。

如果两个变量之间的关系(可用回归系数表达)存在空间异质性,也就是在不同的地方有不同的回归系数,统计学将这种变量关系的空间异质性称之为空间非平稳性

所以地理加权回归应运而生,它考虑了空间关系的影响。

其中(ui,vi)为第i个采样点的坐标;βk(ui,vi)是第i个采样点上第k个回归参数,为空间地理位置函数,通过房价例子来看,加入地理位置函数可以反映房屋价格随地理位置的变化而变化的规律。

4. 加权篇

根据地理学第一定律,”所有事物之间都有关系,但是相近的事物关联更紧密“。

因为地理加权回归中的回归参数在每个数据采样点上都是不同的,所以不能直接利用参数回归方法估计其中的未知参数,我们需要对每个采样点都进行一个估计,有多少采样点就估计多少个β。100个点就估计100个β,β1-βn的估计便是加权最小二乘,这个权重便是W(u0, v0),为什么要考虑空间权重呢,它的作用就是衡量回归点要借用周围哪些样本点去进行估计,换句话说,空间权重决定了(如下图底部蓝色的圆圈)圈的大小。这个圈范围大了,那就变得与传统线性回归一样了,范围小了呢样本点太少就没有意义了。

传统的线性回归估计是没有上式中W(u0, v0)这个空间权重矩阵的,所以没有考虑到距离对于采样点之间的相互影响,也就是没有体现地理学第一定律。

图中红圈的两个点本来就很近,假如被划分到两个不同的局部区域中,这样的话他们两个之间的相互影响关系都没有被考虑进去。图片来源是基于地理加权回归算法的中国台风设计风速区划图文章

所以根据数据所处空间位置,以不同数据点和回归点的空间距离为基础,对各数据点赋予不同的权重,离得近得样点在计算时候占的权重更大,离得远的样点占的权重小而后建立局部区域的加权回归方程。

根据地理学第一定律,GWR模型计算权重的基本原则为“距离越近,赋予的权重值越高;反之,权重值越低”。然后权重的具体计算(就是上图中的锥形),是通过关于空间距离的单调减函数实现,称之为核函数。有全局(Global)函数,距离阈值(Box-Car)函数,指数(Exponential)函数,高斯(Gaussian)函数,双重平方(Bi-square)函数(一般都是这两种),三次立方(Tri-cube)函数。

5. 带宽篇

带宽与核函数紧密相关。带宽(就是上图中的那个θ)变大,锥形就比较平缓,权重衰减的就慢,带宽变小,锥形就比较陡峭,权重衰减的很快。如何确定带宽下次再说啦。

水平有限,有些过程没有表达很清楚,特别是加权,如有错误欢迎指正和补充。

ArcGIS与地理加权回归GWR【一】相关推荐

  1. ArcGIS与地理加权回归【三】

    开   工    大    急 原址链接: ArcGIS与地理加权回归[三]https://mp.weixin.qq.com/s/x85EXKImSHio1IZovW9qdA 接着5个月之前..... ...

  2. R语言GWR地理加权回归

    最近需要用到GWR地理加权回归,数据量有5万条,使用了GIS.GWR4进行计算,但都没能成功.应该是数据量过大. 参考相关博客,还有一个方法是R语言的实现.因为没怎么接触过R语言,所有想请问一下各位, ...

  3. gis中的加权求和工具在哪里_干货分享 | 地理加权回归介绍及其arcgis软件操作

    一.地理加权回归模型概述 橘生淮南则为橘,生于淮北则为枳,叶徒相似,其实味不同.所以然者何?水土异也.--<晏子春秋·内篇杂下>这段文字很好的描述了空间异质性.从地理空间的角度,经济发展尤 ...

  4. 白话空间统计二十四:地理加权回归(八)结果解读(一)

    地理加权回归分析完成之后,与OLS不同的是会默认生成一张可视化图,像下面这张一样的: 这种图里面数值和颜色,主要是系数的标准误差.主要用来衡量每个系数估计值的可靠性.标准误差与实际系数值相比较小时,这 ...

  5. spgwr | R语言与地理加权回归(Ⅰ-1):线性地理加权回归

    地理加权回归(Geographically Weighted Regression, GWR)经过多年发展,已经具备了多种形式,在R语言中也对应着多个工具包,其中spgwr是一个开发较早.比较经典的工 ...

  6. 地理加权回归 | 模型如何应用于新数据的预测?

    专注系列化.高质量的R语言教程 推文索引 | 联系小编 | 付费合集 有读者不知道如何用地理加权回归去预测新的数据.本篇以常用的两个工具包为例进行介绍. 本篇目录如下: 0 数据准备 1 spgwr工 ...

  7. 空间地理加权回归stata_xy妙妙屋丨地理加权回归和空间自相关

    关于地理加权回归和空间自相关 菜鸡的我只是大神文章的搬运工orz,本意是想搞清楚双变量局部空间自相关和地理加权回归的区别,虽然依旧一知半解,但是,害.(下面网址我不会搞超链接,我发现有点麻烦,所以我懒 ...

  8. R语言地理加权回归数据分析

    在自然和社会科学领域有大量与地理或空间有关的数据,这一类数据一般具有严重的空间异质性,而通常的统计学方法并不能处理空间异质性,因而对此类型的数据无能为力.以地理加权回归为基础的一系列方法:经典地理加权 ...

  9. spgwr | R语言与地理加权回归(Ⅰ-2):广义线性地理加权回归

    本篇来介绍基于广义线性模型的地理加权模型.广义线性模型包括Logistic模型.泊松模型等系列回归模型,具体内容请查看数学模型专辑的相关系列推文. 广义线性GWR的使用方法与线性GWR类似: ggwr ...

  10. 白话空间统计二十四:地理加权回归(九)结果解读(二)

    实际上,除了辅助表以外,GWR还会生成一份全要素的表.对回归的每一个样本都给出相应的信息,今天就来看看这些信息代表了什么内容. 生成的新的要素类字段信息如下: 实际上,Coeffcient(系数)和S ...

最新文章

  1. NLP——基于transformer 的翻译系统
  2. 打印正整数n之内的斐波那契数列
  3. 9、 InnoDB行锁
  4. MCtalk教育快报 | 0813
  5. apache性能调优
  6. python全栈开发_day20_加密模块和excel操作模块以及xml
  7. 【神经网络与深度学习摘要】第1章 绪论
  8. Shiro和Zuul权限管理整合方案
  9. 易语言大漠进行字库制作的时候出现不能展示二值化区域
  10. Android录屏解决方案调研
  11. 摹客 PS 插件,支持自定切图尺寸!
  12. 2018云计算行业现状及2020年云计算发展趋势
  13. java的流间隔问题_java – SuperMemo(SM-2)的间隔重复算法
  14. python初学火车座位判断_初学Python实现学校图书馆座位自动抢座预约
  15. 阿里云服务器发送邮箱失败问题
  16. opencv入门Vec3f
  17. iOS自动化打包发布之fastlane 实现 发布AppStore 蒲公英
  18. java读取共享文件夹
  19. Lingo练习 选拔问题
  20. android sim卡 信息,android-如何使用SIM2或双SIM卡提交短信

热门文章

  1. Java连接MySQL数据库步骤
  2. 【SQL Server 2016】【SSMS 17】安装
  3. 牛客网算法题目-最优乘车题解
  4. UE4下载与存储图片
  5. Keil V4安装教程
  6. python 随机选择数字
  7. 新闻管理系统(C#)
  8. git解决路径过长问题
  9. Java2实用教程(第6版)实验指导与习题解答
  10. 工信部强化车联网安全监管、上云可有效阻止勒索攻击|全球网络安全热点