到目前为止,我们接触到的都是可以指定确切数值的概率分布。然而并非所有数据 集合都是如此,还有几类数据并不符合我们之前遇到的概率分布。我们将在这一章 里讲解所谓的连续型概率分布,并介绍最重要的概率分布类型之一——正态分布。

1. 离散分布并非无所不能

离散数据可取确切值

前面讲到的概率分布涉及的都是离散数据,即数据由一个个单独的数值组成,其中的每一个数值都有相应概率。离散数据往往能以某种方式进行计数,例如糖果机中的糖果数目,智力游戏中答对的问题的数目,或是机器在一个特定时段内的故障次数。


但并非所有数值型数据都是离散的

列举一个数据集中的所有数值并不总是能够实现。有时候,数据涵盖的是一个范围,这个范围内的任何一个数值都有可能成为事件结果。

例如,假定有人让你精确地测量几段丝线的长度,并且已知这些丝线的长度在10英寸到11英寸之间,你的测量结果可能会是10英寸、10.1英 寸、10.01英寸,等等,因为丝线长度可以是这个范围内的任意值。

这样的数据叫做连续数据,连续数据往往通过测量得到,而不是通过计数得到,测量结果在很大程度上取决于测量精度要求。


2. 连续数据的概率分布

前面我们讲过:离散数据可以通过计数做出频数(频率)表,绘制出频率分布图(很细的柱状图),只不过纵坐标不是频数,而是频率。这些横坐标上所有数值或类别对应的频率之和等于1。

对于离散概率分布来说,我们关心的是取得一个特定数值的概率;而对于连续概率分布来说,我们关心的是取得一个特定范围的概率。例如:身高在160-170cm范围的概率。

概率密度函数可用于描述连续数据

我们可以用概率密度函数描述连续性随机变量的概率分布。

概率密度函数f(x)是这样一种函数:通过它可以求出一个数据范围内的某个连续变量的概率,它向我们指出该概率分布的形状。

我学习了2年的微积分终于可以派上用场了。

概率=面积

连续随机变量的概率通过面积表示。为了求出一个特定数值范围的概率,首先可画出概率密度函数,位于函数图形下方且介于这个特定数值范围之间的面积就是这个特定数值范围的概率。

我必须用面积求概率吗?不能把那个范围里的数值一个一个选出来,再把这些数值的概率加起来吗?以前离散概率就是这么求的?

这种做法不适用于连续概率

就好像不同于,对于连续概率,我们必须通过计算概率密度曲线下方的面积得出概率


有问必答

  • 问: 有一种函数叫做概率密度函数,那么什么是概率密度?

  • 答: 概率密度指出各种范围内的概率的大小,通过概率密度函数进行描述。它与我们在第一章碰到过的频数密度十分相似。概率密度通过面积标示概率大小,而频数密度通过面积标示频数大小。

  • 问: 难道概率密度和概率不是一回事?

  • 答: 概率密度是一种表示概率的方法,但它并非概率本身。概率密度函数是图形中的一条线条,而概率则是这条线下方的一定数值范围内的面积。

  • 问: 关于概率范围,你已经讲过不少。我如何求出一个精确数值的概率?

  • 答: 在处理连续数据的时候,实际上考虑的是一个可以接受的精度,并且基于这些数值形成一个范围。让我们看一个例子: 假定你想要一段丝线,长度10英寸,精确到英寸。虽然“你需要一段正好长10英寸的丝线”这种说法最容易脱口而出,但这并不完全正确。你真正想要的是一段长度介于9.5英寸到10.5英寸之间的丝线,因为你想让这段10英寸长的丝线“精确到英寸”。即,你想求出长度介于9.5英寸到10.5英寸这个范围内的概率。

  • 问: 如果我想求连续数据某一个精确的数值的概率,会是多少?

  • 答: 结果为0——猛一听可能会觉得有违直觉,但你的问题其实可以这样理解:求一个具有无穷小数位数的精确数值的概率。让我们再以丝线长度为例:如果你需要一段长度正好等于10英寸的丝线,会出现什么局面?——你会需要用一台高倍放大镜,以原子大小为精度,量出一段10英寸长的丝线,“丝线的长度正好为10英寸”这个事件基本上不可能发生。也就是其概率为零。

END

大家感兴趣的话可以跟着一起学,更多R语言数据分析及可视化内容,长按或扫描下方二维码关注“橡树学堂”详细了解:

关注橡树学堂,每天学一点R语言,让我们爱上数据分析可视化

正态分布是离散分布还是连续分布_简单统计学|正态分布之连续数据的概率分布...相关推荐

  1. 正态分布是离散分布还是连续分布_高中就开始学的正态分布,原来如此重要

    我们从高中就开始学正态分布,现在做数据分析.机器学习还是离不开它,那你有没有想过正态分布有什么特别之处?为什么那么多关于数据科学和机器学习的文章都围绕正态分布展开?本文作者专门写了一篇文章,试着用易于 ...

  2. 正态分布表怎么查表_《深入浅出统计学》-读书笔记-再谈正态分布的应用

    目录: 橘猫吃不胖:<深入浅出统计学>-读书笔记-正态分布的应用​zhuanlan.zhihu.com <深入浅出统计学>,第九章,再谈正态分布的应用 上一篇提到的都是单一连续 ...

  3. matlab中表示拉普拉斯分布_神奇的正态分布

    在统计学中有各种各样的分布,称为统计分布,例如有离散型的伯努利分布.二项分布.超几何分布.几何分布.负二项分布.泊松分布,有连续型的均匀分布.指数分布.t分布.卡方分布.F分布.正态分布等等,其中正态 ...

  4. ⅰcp经济模型_简单介绍一下R中的几种统计分布及常用模型

    统计学上分布有很多,在R中基本都有描述.因能力有限,我们就挑选几个常用的.比较重要的简单介绍一下每种分布的定义,公式,以及在R中的展示. 统计分布每一种分布有四个函数:d――density(密度函数) ...

  5. python编写一个简单的程序、验证数据是否符合正态分布_Python检验数据是否正态分布...

    判断数据是否符合正态分布,比如使用3-sigma判断数据异常前,首先需要确定的是数据是否符合正态分布.今天一起梳理下检测正态分布的方法. Shapiro-Wilk test Shapiro-Wilk ...

  6. catia 桥接曲面圆角_4.3.7.1-Catia曲面之多桥接曲面_简单构面

    本节内容主要介绍了Catia曲面之多桥接曲面_简单构面,视频时长7分59秒.桥接曲面是对一些连续的曲面创建过渡曲面使其缝合,其命令操作非常简单但是实际应用中比较难尤其是其支持面的选择,因此学习时要掌握 ...

  7. python搭建_简单_交易系统【转载】

    python搭建_简单_交易系统[转载] 构建account_class 类 构建所需函数 构建最大回撤.收益率.回测函数 构建银行翻倍.选股函数 回测实证分析 (转自 https://www.joi ...

  8. 计算机背小学英语吗,小学英语电脑版背单词软件哪个好_简单背单词软件

    小学英语电脑版背单词软件哪个好_简单背单词软件 内容预览 小学英语背单词软件bother.mp4 小学英语背单词软件boudoir.mp4 小学英语背单词软件confuse.mp4 小学英语背单词软件 ...

  9. 整理总结:深入浅出统计学——正态分布的运用

    参考资料:电子工业出版社的<深入浅出统计学> 前言 并非所有数据集合都是离散的.可以指定确切数值的概率分布,其中也有数值型的概率分布,最典型的便是正态分布. 本篇目录 参考资料:电子工业出 ...

  10. 网摘_技能_IT_后端_存储_简单卷、跨区卷、带区卷、镜像卷和 RAID-5 卷 区别

    网摘_技能_IT_后端_存储_ 简单卷.跨区卷.带区卷.镜像卷和 RAID-5 卷 区别 2013-05-30 21:41:32 梦科 阅读数 4071更多 分类专栏: 存储.灾备 Windows S ...

最新文章

  1. HashMap 和 Hashtable 的 6 个区别,最后一个没几个人知道!
  2. 不能成为专业软件测试人员的10大理由
  3. 腾讯郭振宇:腾讯云发布云IoT全栈产品矩阵,详解6大产品及3大案例
  4. LeetCode—210. 课程表 II
  5. windows下apache建立不同虚拟主机
  6. 光凭 5G 根本无法解决宽带问题!
  7. totolink服务器未响应,WiFi效果差的罪魁祸首竟然是这个 TOTOLINK为你深度讲解
  8. Python 过滤a文件中每一行内容,保存到b文件中
  9. KETTLE、spoon使用
  10. 软件工程之图书管理系统总体设计
  11. viewHolder的作用
  12. select into from 与 insert into select用法详解
  13. 从外观来看微型计算机由哪几个部分组成,福师11春学期《计算机应用基础》在线作业一...
  14. Chrome浏览器输入不安全站点,没有继续前往链接--解决方案thisisunsafe
  15. win10连接android手机助手下载,完美Win10手机助手电脑版
  16. 【专题5: 硬件设计】 之 【39.案例三:碎纸机,光电传感器电路原理图】
  17. c语言程序设计作业电话簿,C语言设计简易电话簿
  18. 超声检查腕骨间关节有助于最大程度地发现RA腕骨间滑膜炎
  19. 数据挖掘经典书籍推荐
  20. 诺基亚论坛PRO数位红

热门文章

  1. 问的书写规则是什么意思_汉字笔顺的书写规则是什么
  2. QWE解码Python实现【网络攻防CTF】(保姆级图文)
  3. c语言求5个整数最小公倍数,C语言求两个正整数的最小公倍数和最大公约数
  4. DNS与GTM协同工作原理
  5. GIS就业参考系列之方向篇——条条大道通罗马
  6. Mac Yapi 内网安装保姆级步骤
  7. python定义函数求和_Python定义函数实现累计求和操作
  8. fatal: Authentication failed for ‘https://github.com/xxx/xxx.git/’解决方法
  9. 数据库无法插入Could not set property ‘id‘ of ‘class com.XXX‘ with value ‘1481832253064073217‘
  10. 男人们必知的人生定律