白话空间统计十九:热点分析(上)

哈罗,各位好,话说虾神已经消失很久了,很多人在问是不是停止更新了?那肯定是不可能的,虾神发下宏愿,要把白话空间统计写完的。只不过这段时间遇上各种加班和一年一度的用户大会,所以就断掉了一段时间……

好吧,废话不多说,进入正题。虾神回归写的第一篇,就是大家期盼已久(虾神自己期盼已久)的热点分析了。

其实,互联网地图在最初经历了浏览查询和路径导航应用以外,在空间分析上,最先让大众所了解的,就是类似这样的热力地图了:

而且某度还直接挂了“热力”地图这样的高大上的名称,所以我们(不明真相的群众们)自然也就把“热点分析”当成了类似于做这种热力图的过程了。

而实际上,会被提出这样一个问题:红色的地方,自然表示热度大,表示人多,这个很容易理解,但是有些被标明是“冷点”的地方,真的是表示人少么?

回答自然不是,正如上面思考的内容,如果蓝色的地方,是冷点,是人少的话,那么没有颜色的地方呢?

所以,得出如下这一结论:

那么,热力图,在空间分析里面,叫做什么呢?实际上,热力图,在空间分析里面,他的专业名词,叫做“密度分析”。而且类似百度这种热力图,仅仅是密度分析里面的“点密度”,也就是代表一个个人的点,单纯的按照数据的多少,来进行聚集,而不去考虑权重、空间关系等内容。

不过,群众喜闻乐见的东西,才是好东西,我对于百度能够将这种空间分析的思路推向大众,那是万分的尊崇的,这才是一个科普工作者应该做的事情。

前面花这么大篇幅讲解,主要就是更正一个名词,热力图,不等于热点分析,所以,我这篇博客写完之后,很多同学肯定会严重的质疑:为什么虾神你的热点分析,做出来的东西和百度的热力图完全不一样捏?所以现在我先进行正名:热点分析不等于热力图、热点分析不等于热力图、热点分析不等于热力图(重要的事情说三遍)。

当然,百度这种热力图怎么做,以后我讲到密度分析的时候,会专门讲,老规矩——挖坑待填……

热点分析的算法叫做Getis-OrdGi* 统计(称为 G-i-星号)。看着是不是很眼熟啊!恭喜你,答对了,我们前面讲过一个“高/低值聚类”,叫做Getis-Ord GeneralG,是由美国乔治敦大学麦克多诺商学院(McDonough School of Business)的J. Keith Ord和圣地亚哥州立大学地理系的Arthur Getis两人提出的,而这个Gi*算法,是这个高低值聚类算法的进阶版。

关于高/低值聚的Getis-Ord GeneralG算法,不记得了的同学请回头去看白话空间统计之十四……这里就不多说了。

那么热点分析是用来干嘛的呢?

我们知道,空间统计里面,最重要的两个值就是P值和Z得分,所以他们首先肯定是计算P值和Z得分的了(不记得P值和Z得分是干嘛的,请看以前的文章)。

通过得到的 z 得分和 p 值,我们可以知道高值或低值要素在空间上发生聚类的位置。但是这个工具的工作方式有些特殊:它查看邻近要素环境中的每一个要素。高值要素往往容易引起注意,但可能不是具有显著统计学意义的热点。要成为具有显著统计需意义的热点,要素应具有高值,且被其他同样具有高值的要素所包围。

听到这句话,是不是又有了似曾相识的感觉了?不错,这个解释不就是Anselin Local Moran's算法要解决的问题么?高的和高的蹲一起,低的和低的蹲一起,如下图:

但是,Anselin LocalMoran's算法,很容易出现下面这样的问题:

我们可以看见,A区域有一个点,值高达10000,其他的点的值都是3,是典型的HL(高值被低值环绕),而B区域都是50,属于标准的低值聚类,但是通过核密度(也就是所谓的热力图)计算,HL区域极度的高热……这就是前面说的,高值要素往往让人特别的关注,但是实际上是否是具有统计学意义上的热点呢?还是未必的。

所以,无论是在心理学里面,还是在实际分析的过程中,都很容易出现这种问题的:

所以,从上面两个例子,我们可以看到,在统计学的热点分析和热力图这种密度分析,是完全不同的概念。那么这个热点分析到底是什么东西呢?欲知后事,请听下回分解。

白话空间统计十九:热点分析(上)相关推荐

  1. 白话空间统计之九:方向分布(标准差椭圆)修正版

    文章用红色字体标记出来的内容是修正后的内容,感谢四川的杨同学对我以前的错误提出指正. 终于写到我最喜欢的一个的工具(算法)了,方向分布是虾神我接触的第一个空间统计工具,也是每次讲空间统计必须要讲的一个 ...

  2. 白话空间统计二十一:密度分析(一)

    白话空间统计二十一:密度分析(一) 密度分析这个概念其实很早就想写了,也有无数同学都问过我,虾神你能不能讲讲那些漂亮的热度图是怎么做的啊?比如下面这种: 如果说,这是互联网地图里面,最让人喜闻乐见的一 ...

  3. 二进制空间权重矩阵_白话空间统计之二十五:空间权重矩阵(三)解构空间权重矩阵...

    原标题:白话空间统计之二十五:空间权重矩阵(三)解构空间权重矩阵 中国古代就有"天圆地方"一说,所谓的"方"就是所谓的矩阵-- 在军事上面,最为讲究就是团体的力 ...

  4. moran指数 r语言_白话空间统计之二十五:空间权重矩阵(四)R语言中的空间权重矩阵(2):不同空间关系对莫兰指数的影响...

    原标题:白话空间统计之二十五:空间权重矩阵(四)R语言中的空间权重矩阵(2):不同空间关系对莫兰指数的影响 上一篇,讲了R语言中的空间权重矩阵的结构,这一节讲讲R语言里面空间权重矩阵的自定义. 与Ar ...

  5. 白话空间统计二十四:地理加权回归(八)结果解读(一)

    地理加权回归分析完成之后,与OLS不同的是会默认生成一张可视化图,像下面这张一样的: 这种图里面数值和颜色,主要是系数的标准误差.主要用来衡量每个系数估计值的可靠性.标准误差与实际系数值相比较小时,这 ...

  6. 新版白话空间统计(1):前言与地理学第一定律

    CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D 转发.转载和爬虫,请主动保留此声明. 前言 2015年7月27日,虾神在csdn博客频道,首次放出第一篇白话空间统计,到今天已经4年多了. ...

  7. 【虾神白话空间统计】笔记:置信度、零假设、PZ值、随机分布

    以下内容摘录节选学习自虾神专栏 很重要的一个概念:在空间统计中,随机和均匀经常是一个意思 一个随机抽样的例子 新版白话空间统计(9):置信度的初探 这里面讲经研究,有72%的男生喜欢打篮球,然后做个随 ...

  8. 白话空间统计二十七:统计学七支柱之空间统计版本(二)聚合(2)

    还记得a long long time ago 的青葱岁月--作为学渣的虾神最怕的就是各种(不擅长)的考试,虾神读书时候有个习惯,就拿到试卷之后,第一时间会把试卷翻到最后一页,去看最后一道大题.然后以 ...

  9. 新版白话空间统计(21)平均最近邻

    前面的章节里面,我们看了很多关于空间分布模式的基本原理,从这一章节开始,我们讲一些具体的工具和算法的使用. 前面我们用莫兰指数.P值.Z得分啥的,可以得出一份数据是属于离散.随机还是聚集,并且通过各种 ...

最新文章

  1. 网络安全中机器学习大合集 Awesome
  2. springcloud——eureka小错误Caused by: java.net.UnknownHostException: eureka7003.com
  3. tcl/tk demo
  4. 爬虫神器Requests: 让 HTTP 服务人类
  5. Node.js 和 Python之间如何进行选择?教你一招搞定
  6. sed手册-3 例子
  7. Bitmap存储入门
  8. form表单ajax上传文件
  9. 树枝学术 | 论文翻译全攻略
  10. SpringCloud (五) ——Feign远程调用
  11. linux里hba状态_Linux下查看FC HBA信息
  12. excel超链接无法打开服务器文件,excle链接的未打开 | excel超链接打不开,超链接后点击出现无法打开指定的文件,求高手解决...
  13. 高仿微信 Windows 端
  14. [CTF密码学]RSA相关题目解题方法与python脚本总结(附例题)
  15. isFile()exists() isDirectory()
  16. JSON以及Ajax
  17. 用 TypeScript 写一个轻量级的 UI 框架之十三:Grid 表格组件(下)
  18. 工程分析 - u-boot
  19. 宏观大数据-模型部署说明 V1.3.1
  20. ftp服务器部署Tomcat项目,tomcat搭建ftp服务器配置

热门文章

  1. 用python 画一个美国队长盾牌
  2. 区块链系统开发实现原理,区块链为什么叫区块链?
  3. Swift强大的数组
  4. TM4C123G 硬件spi
  5. 一刀工具箱 - 经纬度查询
  6. 想编程,是勤奋自学还是去培训班学习?
  7. A man who has iron bone
  8. ergonomic计算机专业英语,[听单词] 计算机专业英语词汇音频52,计算机英语单词MP3...
  9. 信号一会有 一会显示无服务器,为什么有时手机信号差?原来是因为这些原因!...
  10. 第0期-通过hao123爬取导航网站