[GIS原理] 10 空间统计分析
在知识传播途中,向涉及到的相关著作权人谨致谢意!
南师国家精品课程《地理信息系统》——主讲人:韦玉春老师
文章目录
- 背景
- 空间统计分析
- 1 研究目的
- 2 研究内容
- 3 空间统计分析的基本流程
- 4 空间数据
- 5 空间统计中的问题
- 5.1 空间自相关
- 5.2 可变区域单位汇总
- 5.3 生态学谬误
- 5.4 空间尺度
- 5.5 空间非均一性和边界效应
- 6 空间数据的关系
- 6.1 空间格局
- 6.2 空间数据关系
- 本章小结
【本章内容】
- 四个概念:空间分析、空间数据分析、地统计分析、空间统计分析
- 为什么要做空间统计?
- 空间自相关怎么回事?有全局和局部的
- 利用空间自相关可以干嘛?空间插值、空间回归
背景
概念区分 | 说明 |
---|---|
概率论 | 概率论是数理统计的基础,在数理统计中做推断的时候有一个概率性推断 |
数理统计 | 强调数理,数学原理,有大量的公式证明 |
统计学 | 比数理统计更简单,是直接的应用 |
空间分析 |
偏重几何:对空间对象之间关系的分析;通过分析空间坐标的关系得到空间对象的关系 1. 狭义的空间分析:就是几何分析,基于空间坐标的分析(点在面内,缓冲区分析) 2. 广义空间分析:什么都包,只要跟空间相关的都叫空间分析 |
空间数据分析Spatial Data Analysis | 偏重于属性:对具有空间坐标的属性数据分析 |
地统计分析Geostatistics |
强调是区域化变量和自相关的:以区域化变量为基础,借助变异函数,研究具有随机性和结构性、空间相关性和依赖性的自然现象的一门科学 【应用】针对像矿产、资源、生物群落、地貌等有着特定的地域分布特征而发展的统计学。由于最先在地学领应用,故称为地统计学 【起源】主要理论是法统计学家G.Matheron 创立的,经过不断完善和改进,目前已成为具有坚实理论基础和实用价值的数学工具 【相关概念】空间离散化、区域化变量 |
空间离散化 | 空间上有几个点,将空间上几个点的属性离散化到整个空间化上 |
区域化变量 | 如果这个变量能够区域化(这个点在这,通过某种手段扩展到其他地方,能够把它放在一个区域内来表示),它就可以空间离散化 |
地理 |
1. 关于地球的道理。跑到月球上,就叫月球学。地理讲的是格局(分布),什么在哪分布,有什么规律 2. 高中:什么在哪,那有什么。大学:什么东西在哪,为什么在那 3. 利用这些信息可以用于推测预测解释现象,地理信息系统描述这个格局特征是什么,是属于哪种类型。 |
空间统计分析
概念区分 | 说明 |
---|---|
空间统计分析(Spatial Statistics) |
1. 统计分析的主要手段,贯穿于空间分析的各个环节 2. 空间统计分析方法不仅仅限于常规统计方法,还包括基于空间位置和属性的空间分析方法 |
空间数据的统计分析 |
1. 着重于空间对象和现象的非空间特性的统计分析 2. 中心议题是如何用数学统计模型俩描述和模拟空间现象和过程 |
数据的空间统计分析 | 1. 直接从空间对象的空间位置、联系等方面出发,研究具有随机性、结构性或具有空间相关性和依赖性的自然现象 |
1 研究目的
- 描述事物在空间上的分布特征(怎么分布的,动物、土壤的成分含量、植物是怎么分布的)
【三大分布状态、格局】随机;聚集;规则的 - 分析数据的空间自相关性,空间自相关对空间格局的影响,如何利用这种关系构建模型
2 研究内容
说明 | |
---|---|
任务 |
空间统计分析与经典统计学的内容相交叉。空间统计分析使用统计方法解释空间数据,分析数据的“期望”或者在统计上是否是“典型的” 1. 空间统计分析重在解释空间数据,不是预测。解释的目标:加深人们对某些问题的认识 2. 研究对象是一个总体:这里叫期望。假如你的研究对象是一个采样,谈均值,均值是对期望的一种估计 |
研究流程 |
先描述,看是否有自相关 1. 如果有就可以用空间自相关的分析来做插值和回归 2. 如果没有自相关后面就不用做了 |
研究内容 | 空间统计描述;空间自相关分析;空间插值;空间回归 |
研究的问题 |
1. 格局:是规则的,还是随机的,还是集中的 2. 分布有无规律 |
3 空间统计分析的基本流程
【流程】
- 数据测量
- 探索性分析:数据反应了什么规律(是统计分析之上的更高的环境),通过探索的过程得到了一个模糊的认识
- 空间统计
- 空间自相关:空间插值、空间回归
4 空间数据
【问题】空间关系用拓扑关系描述,那空间数据的关系怎么描述?
- 空间统计分析:利用几何信息来研究属性
- 空间数据:具有地理坐标的数据,空间数据=空间几何+属性
- 地点或定位数据
- 线数据
- 面数据
- 体数据
5 空间统计中的问题
5.1 空间自相关
【空间自相关】空间中相近的样点具有某种相似性,相距较远的样点往往不相似-空间自相关
【解释】距离越近越相似,某个东西某个指标相似–>地理学的第一定律
【引申出新的问题】空间自相关性使得传统的统计学方法不能直接用于分析地理现象的空间特征
- 如果满足空间自相关,就不能用传统的统计学方法
【为什么不能用】传统的统计学方法的基本假设就是独立性和随机性。而自相关与之违背,所以传统的不能用了 - 如果不满足空间自相关,可以用传统的统计学方法
【为什么叫空间自相关?】
- 相关:一个变量x发生变化,另一个变量y随着发生变化–>x,y有相关关系–>y=f(x),两个指标x,y
- 自相关:时间序列t,一个东西的值是v–>以前的数值为v,过去的数据跟现在是有关系的–>历史会影响到现在的数据–>说是在时间序列的自相关,是自身的一套数据,不是外来的–>所以说是自相关v=f(t),一个指标v,随着时间t的变换
- 空间自相关:空间是二维的,在空间上是有相互关系的–>都是一套数据,一个指标v,随着空间(x,y)的变化
【例如】温度temperature随着空间(x,y)的变化,即函数T=f(x,y),就称之为温度的空间自相关
5.2 可变区域单位汇总
【解释】汇总的单位不一样,数据的关系会不一样
【举例】按照班来汇总,按照系来汇总,按照学校来汇总,按照省市来汇总–>汇总的单位不一样,收集到的数据结果,这些数据的关系也会不一样
【可变区域单位问题】统计汇总的区域层次不同,统计结果间的关系也就不同
【由汇总单位产生的影响有两个】
- 第一个影响:与分析的空间尺度和汇总效应有关。汇总之后的平均值更接近于回归线,使得散点图的结果更接近于线性,导致相关系数增加。一般通过汇总往往产生更好的拟合结果。
- 第二个影响:是不同汇总方法得到的结果实质上是不同的。
【理解】数据在进行拟合之前先进行汇总–>汇总使数据量变少–>使拟合的效果更好
【原因】因为汇总,导致数据的关系增强,是在汇总层次上的关系,而这种关系可能是虚假的
【解决】研究的基本单位,在基本单位得出来的关系是可靠的
5.3 生态学谬误
【生态学谬误】当特定汇总层次的观察值之间的统计关系假定可以接受,并且在更细的层次接受同样关系的时候,产生这个问题
【简单的说】将得到的整体内的关系推论到个体之中,整体和个体不是一个概念,要区分开
【举例】吸烟有害健康(整体)–>你的身体很差(个体)
5.4 空间尺度
【比例尺】设定了一个尺度和幅度,你是在这个尺度里面认识世界,看到的细节是不一样的
【空间尺度】
- 不同对象的表现需要的不同尺度
- 在大陆尺度,城市用点来表示。在区域尺度,城市用面来表示。在局部尺度,城市成为复杂的点、线、面和网络的集合体
- 研究对象的空间尺度影响空间分析。因此,应当选定正确的或合适的空间尺度
5.5 空间非均一性和边界效应
【空间的不均一性】区分空间分析与传统统计分析的重要标志是空间的不均一性
【边界效应】边界效应是不均一问题的一个特殊类型
【边界举例】行政区划、自然区划
【解释】任何东西都是有边界的,脱离了边界来谈是错误的–>空间的连续性是有边界的,是有条件的
6 空间数据的关系
空间的连续性是有边界的
地理现象的空间连续性是空间属性的最基本性质
6.1 空间格局
空间格局类型:规则分布,随机分布,聚集分布
- 大量规则的:往往是人工的、生物学的建筑
- 聚集分布:生物会有聚集的行为,和随机相比,是相对的
- 随机分布
6.2 空间数据关系
空间数据关系 | 说明 |
---|---|
距离(distance) | 空间实体间的直线距离或球面距离 |
邻接(adjacency) | 在指定的距离之下,我们才有一个邻接的概念(这是一个人为的定义) |
交互(interaction) |
1. 距离和邻接的综合:距离越近的交互越强,距离越远的交互越弱 2. 出发点:事物与近处的关系更密切 3. 数学上:将两个空间实体之间的交互度表示为0(无交互)和1(高度交互)之间的数 |
近邻(neighborhood) |
1. 近邻强调的是成员,邻接强调关系 2. 特定空间实体的近邻是与该实体邻接的其他空间实体的集合 3. 近邻依赖于邻接的定义 |
本章小结
- 通过统计分析进行描述
- 通过空间探索分析确定异常和总体的趋势
- 通过单要素的空间插值获取未知点的数据
- 通过多要素的空间回归获取未知点的数据
[GIS原理] 10 空间统计分析相关推荐
- [GIS原理] 3 空间数据模型
在知识传播途中,向涉及到的相关著作权人谨致谢意! 文章目录 1 相关概念 1.1 地理空间 1.2 空间现象 1.3 空间实体 2 地理空间与空间抽象 2.1 概念数据模型 2.2 逻辑数据模型 2. ...
- 空间统计分析_【空间分析】地理探测器原理
地理探测器:原理与展望 地理学报 王劲峰 徐成东2017 本文只截取了地理探测器原理部分内容,案例分析部分并未呈现. 地理探测器原理: 空间分层异质性:层内方差小于层间方差的地理现象. 地理探测器是探 ...
- 空间句法软件_【特训营2:空间句法高阶班】GIS中的空间句法运用 丨城市数据派...
最新线上特训营 授课老师专业过硬负责空间句法官方中文网站建设作为主要译者翻译空间句法奠基作<空间的社会逻辑>此课程为空间句法高阶课程课程内容覆盖:GIS与空间句法基础理论大数据和空间分 ...
- 机器学习和统计学习的区别:10个统计分析方法
来源:THU数据派(ID:datapi) 无论你在数据科学中是何种立场,你都无法忽视数据的重要性,数据科学家的职责就是分析.组织和应用这些数据. 著名求职网站 Glassdoor 根据庞大的就业数据和 ...
- 数学建模竞赛中必须掌握的10个统计分析方法
无论你在数据科学中是何种立场,你都无法忽视数据的重要性,数据科学家的职责就是分析.组织和应用这些数据. 著名求职网站 Glassdoor 根据庞大的就业数据和员工反馈信息,将数据科学家排名为美国最佳的 ...
- 分析师必会的10个统计分析方法
导读:本文站在统计学家的角度对数据科学常用的一些技术方法进行总结,帮助读者建立直观印象.内容对应的R代码可以在作者的GitHub上找到. 来源:THU数据派 转载:经济结构与周期 无论你在数据科学中是 ...
- 《Web GIS原理与应用开发》读书笔记(5)
第五章 切片地图 以下均掺杂个人理解 书目:Web GIS 原理与应用开发 -- 刘光 曾敬文 曾庆丰 著 如果要提高Web地图的访问速度,使用地图切片的非常有效的方法. 地图切片就是在多个比例尺下配 ...
- 《Web GIS原理与应用开发》读书笔记(1)
第一章 Web GIS 概述 以下均掺杂个人理解 书目:Web GIS 原理与应用开发 -- 刘光 曾敬文 曾庆丰 著 1.1 GIS的发展 20世纪60年代,世界上第一个地信系统:加拿大地理信息系统 ...
- GIS原理与技术-平时作业
文章目录 1. 简述矢量数据模型的基本思想.试分析ESRI公司三种矢量数据产品的数据结构. 2. 几何变换如何定义.分类?简述仿射变换的实现过程. 3. 简述DEM.TIN的模型结构,比较二者的优缺点 ...
最新文章
- PHP memcache实现消息队列实例
- linux mysql 系统时间函数吗_linux下获取系统时间的方法
- python里面的pip是什么意思_Python-pip和conda有什么区别?
- BOOST_PP_CHECK_EMPTY宏相关的测试程序
- [Python从零到壹] 十一.数据分析之Numpy、Pandas、Matplotlib和Sklearn入门知识万字详解(1)
- 征名公布|Qtum量子链企业版—Unita 中文名征集圆满落幕
- 打破冷漠僵局文章_研究僵局–第2部分
- 测试管理_我的敏捷测试
- Android控件学习笔记之 ListView
- Python 神经网络是这样识别手写字符哒?
- Linux htop工具使用详解
- 1.4.1用空间向量研究直线、平面的位置关系教学设计
- 电脑使用ps很卡该怎么办,ps如何设置才不会卡
- 【xlsx-chart】Vue项目中导出Excel表格并带上图表
- 解决:Excel打开文件,内容不显示
- 淘宝商品详情接口抓取
- R 语言 apply 系列函数
- 论文写作-引言怎么写
- 智能家居的优点是非常多,具体有哪些?
- 设计模式袖珍版 连续转载之 - Proxy(代理)
热门文章
- 在国企做程序员是什么体验?真正告别九九六
- C 是编译类高级程序语言 对 错,C言语编译过程中的常见过错
- javascript~获取当前iframe的id和修改iframe属性
- 进销存设计与分析_采购退货单(3)
- Set 和 Array
- BAT文件语法和技巧(bat文件的编写及使用)(转载一)
- GP8101PAC芯片使用及隔离应用
- 用python实现正弦信号sin((pi/2)*t)、sin(pi*t)、 sin((3pi/2)*t)
- Mybatis核心源码赏析(二)
- Anchor-free目标检测论文汇总