CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D

转发、转载和爬虫,请主动保留此声明。

前面说到莫兰指数的时候,挖下了一个大坑——虾神在文章里面里面,一再强调:查看莫兰指数之前,先要看看PZ两个值,如果PZ两个值不可信,那么得到的莫兰指数也是不可信的——

那么这个PZ值是何方神圣,如此之霸气,又有啥意义和道理呢?这几章我们来好好聊聊这个两个在统计学上的“最高审判者”。

要说PZ值,就先要明白“置信度”这个词的概念。当然,如果是统计学专业出生的同学,就不用详述了,在统计学里面,这个概念就是和“hello world”级别,but……鉴于看虾神科普文章的同学,大部分都不是统计学出身,所以我们可以好好的聊聊这个神奇的单词。

汉语八级考试——下面请听题:

  • A:听说老张昨天花大价钱买的古董是假的!

  • B:真的假的

  • A:真的

  • 问:老张买的古董,到底是真的还是假的……

  • 可见,追寻真相的重要性

但是一般来说,在无法去真正的看见真相的时候,我们通常选择是否相信告诉你这件事的那个人,你对事件的真假的信心,来自于你对叙述者的信心。(当然……人类的一个习惯就是“择其所好,避其所忌”,比如“我陷思,定体问”这种模板话术,还有很多人信——

言归正传——

追求真相是人类的天赋技能之一(追求,不是正视真相,因为有绝大部分人不会认可不符合他认知的真相,这也是人类的主要行为之一),那么置信度的意义就呼之欲出了……

置信度,英文原文Confidence interval,其中Confidence翻译成“置信”实际上是追求了信达雅里面的雅……但是在中文里面,置信这个词,一看起来给人的第一印象就是“难以置信”,而这个难以置信又偏偏与奇迹发生在一起,所以这个词在理解上,就让没有受过严格统计学理论训练的同学们理解得死去活来依然理解不了。

那么,我们从英文原文来咬文嚼字的话,Confidence有信心的意思,实际上最早这个词,也是用来标识“信心”这种非常主观意味的意思。所以与其用这么学术化的术语来描述的话,还不如直接用一个通俗易懂的名词来进行描述,就是:信心。

比如,我说,我这个实验结论,有95%的置信度……那么意义绝对不是说,这个实验做100次,有95次一定能够得到和我一样的结果,而是可以理解为,对于这种结果,我有95%的信心重现这个结论

好了,看到这里,大家应该隐隐约约知道这个置信度是啥概念了……原始概念上,它代表了一种主观因素。

那么下面来看看这几个例子,让我们来加深一下理解:

比如,虾神在一个学校里面,做了这样了一个调查,然后回来说,据我调查,这个学校,有72%的男生喜欢打篮球。

上面这个例子,说明了什么呢?

1、如果这个学校有1000名男生,是不是说明有720人喜欢打篮球?

2、如果某个班,有30名男生,那么这个班最少有21人喜欢打篮球?

3、在操场上,随机抽出10个男生来,是不是最少有7个男生是喜欢打篮球的?

4、在图书馆门口,随机拦下出入的100个男生,是不是应该有72个男生喜欢打篮球?

……

如果你受过系统的统计学训练,就很容易回答上面这4个问题 了……就算你没有受过系统的统计学训练,你也能隐约感受出来,这个72%的比例,绝对不会让上面那四个问题,全部都回答为“是”。

那么这个72%的男生喜欢打篮球,又有啥意义呢?下面通过一个简单的实验来进行模拟:

可以看到,虽然总体上72%的男生喜欢打篮球,但是我们在抽样的时候,真实抽出72%的标准概率的可能性,只有不到千分之一。这也是统计学里面一个很核心的概念:一切结论皆概率。

再来看看置信度里面第二个单词:interval,即区间、区域的意思,所以有些书上,置信度也被翻译成置信区间。

什么是区间呢?一个区间是由上限和下限两个值组成,比如我们说,人类的年龄正常应该在0-130岁之间(正常情况来说——不要和我谈玄幻剧本,也不要和我谈地摊文学……)。

那么如果我随便指定一个存在过的人,让你猜他活了多少岁(在哪个区间内)?如果想必中,猜的方法肯定是直接说0岁到130岁——你猜的区间越大,猜中的概率就越高——区间大小为99.999%,自然就99.999%中。

这个就是区间的概念。当然,统计学里面还要谈置信水平,也就是样本值落在统计值的哪个区域内的概率,区间是在这个水平之下的评估。下面我们通过一个简单的例子来说明一下:

(灵魂画手虾神亲手鼠绘)

比如我向着整面墙那么大的靶子扔飞镖——首先,排除掉一切其他可能性(比如飞镖坏了、墙塌了,虾神出手的一瞬间外星人把虾神绑架了等等问题),保证飞镖一定会钉在靶子上面。

那么现在让你在虾神蒙着眼镜出手之前,就画一个区域,保证你画的这个区域,一定能够包含这个飞镖的落点,那么怎么画呢?

回答当然是区域画得越大越好——

如果你绘制的区域,占到整面墙的99.9999%,那么虾神随手一扔,然后飞镖还在你画的区域以外的话,那就是发生了极低概率事件,通常我们也把这种事件,叫做——奇迹。

同样的,如果要去打赌,你画得越,你对自己胜利的信心肯定也就越大——自然,置信度也就越大。

所以,在我们做统计分析时候,我们会尽量的去把我们的靶子落点区域,绘制得更大,越大,那么我们胜利的信心也就越大,反之亦然成立。

当然,世事无绝对,就算我们绘制到了99.9999……%,那么还出现了意外,怎么办呢?所以不同于如小孩在看电视的时候,会问“这个是好人还是坏人”,统计学的世界里面,不会出现非黑即白这种简单的观点。任何时间,在统计学的世界里面,都是概率,只有大概率事件和小概率事件两种可能。而极小概率事件,也就是所谓的奇迹概率,不在我们讨论范围内。

说到这里,大家应该对置信度这个概念有一定的了解了,那么我们在做分析或者写论文的时候,这个置信度(信心)又是怎么来的呢?难道真的就是靠着人一拍胸脯说:

那么我估计你的导师或者你的论文评审,会直接把论文摔在你的脸上……

所以,我们就得通过所谓的量化标准,来说明我们的信心到底有多少,这就引入了下一个问题:P值与Z得分

预知后事如何,请听下回分解:

请叫我挖坑小能手

转发、点赞、打赏……随缘

CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D

转发、转载和爬虫,请主动保留此声明。

新版白话空间统计(9):置信度的初探相关推荐

  1. 新版白话空间统计(21)平均最近邻

    前面的章节里面,我们看了很多关于空间分布模式的基本原理,从这一章节开始,我们讲一些具体的工具和算法的使用. 前面我们用莫兰指数.P值.Z得分啥的,可以得出一份数据是属于离散.随机还是聚集,并且通过各种 ...

  2. 新版白话空间统计(1):前言与地理学第一定律

    CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D 转发.转载和爬虫,请主动保留此声明. 前言 2015年7月27日,虾神在csdn博客频道,首次放出第一篇白话空间统计,到今天已经4年多了. ...

  3. arcgis设置nodata值_新版白话空间统计(6):在ArcGIS中实现莫兰指数计算

    上一篇简单说了一下莫兰指数的计算原理和计算公式,如果是学生或者基础研究者,鼓励好好的学习一下手算或者编程计算,所谓的基础不牢,地动山摇--但是对于工程界和应用人士,特别是非基础学,重复造轮子是没有啥意 ...

  4. 新版白话空间统计(6):在ArcGIS中实现莫兰指数计算

    CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D 转发.转载和爬虫,请主动保留此声明. 上一篇简单说了一下莫兰指数的计算原理和计算公式,如果是学生或者基础研究者,鼓励好好的学习一下手算或者编 ...

  5. 新版白话空间统计(13):随机的力量

    CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D 转发.转载和爬虫,请主动保留此声明. 前文再续,书接上一回,先请出本节镇文神图: 看到这张图,可能很多同学会问,随机不是没有分析的意义么?你 ...

  6. 新版白话空间统计(25):方向分布(标准差椭圆)

    方向分布是虾神最喜欢的一个空间统计工具,也是最简单明了,但是用处很广的一个 点模式的分析中,一般会考察如下五种内容: 1.点的疏密,包括点数据的分布探索,是否一致.均匀或者不均匀. 2.点的方位,包括 ...

  7. 新版白话空间统计(22):中心要素

    CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D 转发.转载和爬虫,请主动保留此声明. 美国著名统计学家,统计学史专家,芝加哥大学统计学院教授Stephen M. Stigler(斯蒂芬.斯 ...

  8. 新版白话空间统计(15)空间关系概念化之距离

    CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D 转发.转载和爬虫,请主动保留此声明. 首先祭出镇文神图: 空间统计学最核心的,就是对空间区域分布特性进行研究,所以要做任何空间分布分析,就需 ...

  9. 新版白话空间统计(16)空间关系概念化之固定距离

    CSDN的被爬虫专用声明:虾神原创,公众号\知乎:虾神说D 转发.转载和爬虫,请主动保留此声明. 镇文神图: 中学物理第一课就是参照物的说明,空间统计里面的各种分析,有着天然的参照物,也就是物理存在的 ...

最新文章

  1. 2016.4.2 动态规划练习--讲课整理
  2. 这可能是东半球最保姆级的后台服务器开发学习路线
  3. Android AlarmManager 使用指南
  4. Python多线程——递归锁RLOCK
  5. pandas如何保存在excel里面_【精选】Pandas一站式教程!
  6. 微服务架构下 CI/CD 如何落地
  7. 光纤以太网交换机产品性能介绍
  8. IP种子——网络安全的重要组成部分
  9. ibm的odm使用_使用IBM ODM API生成规则工件
  10. 梦想贵在坚持 第一周(1.9-1.15)
  11. 区块链安全:实现公链双花攻击的多种方法
  12. kjb文件 解析_NVH原始数据文件如何读取 Part2
  13. 为什么职场公众号最容易变现?
  14. Redis 客户端使用与监控
  15. 机器学习中的概念---输入空间、标记空间、样本空间、假设空间、版本空间
  16. 大数据-Logstash
  17. Laplace近似后验概率
  18. mask_rcnn keras源码跟读3)配置文件
  19. 计算机主机上授权许可标签,计算机安装软件抽查登记表填表及操作说明.DOC
  20. ShaderGraph节点——Procedural

热门文章

  1. 项目一 Windows Server 2012 R2服务器安装与配置
  2. AcWing 3725. 卖罐头
  3. 计算机辅助设计软件应用答案,专科《计算机辅助设计软件地应用》_试卷_答案.docx...
  4. 历史上几次股市大崩盘
  5. kde调整分辨率_7个很酷的KDE调整将改变您的生活
  6. 童年修复系列-PC Engine/TurboGrafx-16介绍及FPGA实现
  7. 华为鸿蒙os设置界面,华为鸿蒙OS系统界面疑似曝光 运行性能提升超60%
  8. MindMapper使用技巧分享
  9. 基于SpringBoot的智能物流监控系统数据系统
  10. 正在遭受黑客攻击的脆弱电网