数据分析(1)——统计学中的各种分布

  • 1. 离散概率分布
    • 1.1 二项分布
      • 1.1.1 二项分布的定义及其公式
      • 1.1.2 二项分布的性质(适用情况)
      • 1.1.3 例题
    • 1.2 伯努利分布
      • 1.2.1 伯努利分布的定义及其公式
      • 1.2.2 伯努利分布的适用情况(举例)
    • 1.3 几何分布
      • 1.3.1 几何分布的定义和公式
      • 1.3.2 几何分布的适用情况(与二项分布的区别)
      • 1.3.3 几何分布的题目
    • 1.4 泊松分布
      • 1.4.1 泊松分布的定义和公式
      • 1.4.2 泊松分布的性质
      • 1.4.3 泊松分布的适用情况(例题)
  • 2 连续概率分布
    • 2.1 指数分布
      • 2.1.1 指数分布定义和公式
      • 2.1.2 指数分布适用情况
      • 2.1.3 指数分布与泊松分布的区别
    • 2.2 均匀分布
      • 2.2.1 均匀分布的公式
    • 2.3 正态分布(高斯分布)
      • 2.3.1 正态分布定义及公式
      • 2.3.2 正态分布的特征
      • 2.3.3 正态分布的性质
  • 小结

1. 离散概率分布

1.1 二项分布

1.1.1 二项分布的定义及其公式

① 定义:在给定每次实验的成功概率p、实验次数n的情况下,成功数x的频数分布。
在二项分布中,关注的是在n次试验中成功出现的次数。
② 二项分布的概率函数:


③ 二项分布的数学期望和方差:

1.1.2 二项分布的性质(适用情况)

① 实验由一系列相同的n个实验组成
② 每次实验都有两种可能结果,及成功和失败
③ 每次实验成功的概率相同,用p表示,失败概率则为1-p
④ 实验都是相互独立的

1.1.3 例题

如果链接点击转换为购买的概率为0.02,那么观测到200次点击但没有购买的概率?

解答:

  • 题为求200次没有成功的概率(1-200次中成功一次的概率),服从二项分布
  • p = 0.02 , n= 200, x = 1
  • 观测到200次点击但没有购买的概率为:

1.2 伯努利分布

1.2.1 伯努利分布的定义及其公式

① 定义:在二项分布n=1时的特例,一次随机实验,成功的概率为p,失败的概率为q=1-p,成功的次数也只有0和1两种情况。
② 概率密度:

③ 期望和方差:

1.2.2 伯努利分布的适用情况(举例)

抛硬币(正反)、检测产品(合格 不合格)、买彩票(中奖 未中奖)

1.3 几何分布

1.3.1 几何分布的定义和公式

① 定义:在重复多次的伯努利实验中,实验进行到某种结果出现第一次为止,此时的实验总次数符合几何分布。
② 概率密度:

其中,p为成功的概率,即为了在第x次尝试取得第1次成功,首先要失败(x-1)次。
③ 期望和方差:

1.3.2 几何分布的适用情况(与二项分布的区别)

二项分布关注“n次实验中成功x的概率”,几何分布关注“第x尝试取得第1次成功的概率”。

1.3.3 几何分布的题目

例:一位滑雪者不出意外顺利滑至坡底的概率为0.4,求
① 前10次滑雪失败,第11次成功的概率
② 第4次或者不足4次就成功的概率
③ 4次以上才能成功的概率

解答:
① 前10次滑雪失败,第11次成功的概率:

② 第4次或者不足4次就成功的概率:

③ 4次以上才能成功的概率:

1.4 泊松分布

1.4.1 泊松分布的定义和公式

① 定义:单位时间内或者单位空间中事件数量的频数分布
② 概率密度:

其中,泊松分布的参数λ是单位时间(单位面积)内随机事件的平均发生次数。
③ 期望和方差:λ
④ 分布图:

1.4.2 泊松分布的性质

① 在任意两个相等长度的区间上,事件发生的概率相等。
② 事件在某一区间上是否发生与事件在其他区间是否发生是独立的。

1.4.3 泊松分布的适用情况(例题)

如:一小时内到达候车厅的人数、10英里长的高速路上需要维修的路段数目

工作日早上15min内到达某银行出纳窗口的汽车数量:
历史数据显示,15min内到达车辆的平均数为10,求15min内恰好到达五辆车的概率。

解答:

2 连续概率分布

2.1 指数分布

2.1.1 指数分布定义和公式

① 定义:建模各次事件之间的时间分布情况

② 概率密度函数:

③ 分布函数:

④ 期望与方差:

⑤ 分布图:

2.1.2 指数分布适用情况

如:网站访问的时间间隔、汽车抵达收费站的时间间隔

2.1.3 指数分布与泊松分布的区别

泊松分布描述了每一区间中事件发生的次数,
指数分布描述了事件发生的时间间隔长度。

2.2 均匀分布

2.2.1 均匀分布的公式

① 定义:均匀分布也叫矩形分布,它是对称概率分布,在相同长度间隔的分布概率是等可能的 。
② 概率密度:

③ 概率分布:

④ 期望和方差:

⑤ 分布图:

2.3 正态分布(高斯分布)

2.3.1 正态分布定义及公式

① 定义:经常用在自然和社会科学来代表一个不明的随机变量,比如人的身高和体重、考试成绩、科学测量、降雨量等,都近似正态分布。
② 概率密度:

当期望=0,方差=1时,为标准正态分布:

③ 分布图:

2.3.2 正态分布的特征

① 正态曲线的最高点在均值处,均值还是分布的中位数和众数
② 正态分布是对称的
③ 标准差决定曲线的平坦程度,标准差越大,曲线越平坦
④ 正态随机变量的概率是由正态曲线下的面积给出

2.3.3 正态分布的性质

小结

  • 在离散分布中,要区分二项分布与几何分布的区别。
  • 要明确知道各个分布的适用情况以及大概的分布图示。

数据分析(1)——统计学中的各种分布相关推荐

  1. 统计学中常见的分布汇总及相关概念

    常见分布 统计学中有很多常见的分布,在此对这些分布进行梳理. 离散型随机变量分布 1.离散型均匀分布 若随机变量有n个不同值,具有相同概率,则我们称之为离散均匀分布,通常发生在我们不确定各种情况发生的 ...

  2. 统计计量 | 统计学中常用的数据分析方法汇总

    来源:数据Seminar本文约10500字,建议阅读15+分钟 统计学中常用的数据分析方法汇总. Part1描述统计 描述统计是通过图表或数学方法,对数据资料进行整理.分析,并对数据的分布状态.数字特 ...

  3. 统计学中数据分析方法大全!

    来源:数据派THU 我是小z 之前有断断续续讲过统计学中的数据分析方法,今天分享的这篇更加全面.系统,涉及到18个方面,收藏就完事儿了~ Part1描述统计 描述统计是通过图表或数学方法,对数据资料进 ...

  4. 蓬莱小课:史上最全,统计学中常用16个数据分析方法大总结

    统计学是一种利用数学理论来进行数据分析的技术,通过统计学我们可以用更富有信息驱动力和针对性的方式对数据进行操作. 在数据分析工作中,利用统计学,我们可以更深入.更细致地观察数据是如何进行精确组织的,并 ...

  5. python 绘制分布直方图_统计学中常见的4种抽样分布及其分布曲线(Python绘制)...

    现代统计学奠基人之一.英国统计学家费希尔(Fisher)曾把抽样分布.参书估计和假设检验看作统计推断的三大中心内容. 统计学中,需要研究统计量的性质,并评价一个统计推断的优良性,而这些取决于其抽样分布 ...

  6. 耿直:统计学中的因果推断问题(Causal Inference)

    来源:量化研究方法 本文约3000字,建议阅读5分钟. 数学科学学院耿直老师为你介绍统计学中的因果推断问题. 今天,小编带来了数学科学学院耿直老师关于统计学中因果推断问题的介绍.文中介绍了几种分析因果 ...

  7. matlab中表示拉普拉斯分布_神奇的正态分布

    在统计学中有各种各样的分布,称为统计分布,例如有离散型的伯努利分布.二项分布.超几何分布.几何分布.负二项分布.泊松分布,有连续型的均匀分布.指数分布.t分布.卡方分布.F分布.正态分布等等,其中正态 ...

  8. 统计学中基础概念说明

      如果觉得文章写得好,如果你想要博客文章中的数据,请关注公众号:[数据分析与统计学之美],添加作者[个人微信],进群和作者交流! 目录   1.什么是描述性统计?   2.统计量    1)常用统计 ...

  9. 拓扑数据分析在机器学习中的应用

    作者:曾凤 责任编辑:周建丁(zhoujd@csdn.net) 本文为<程序员>原创文章,未经允许不得转载,更多精彩文章请订阅2016年<程序员>http://dingyue. ...

最新文章

  1. centos下mysql常用的三种备份方法_centos下mysql自动备份(全量)
  2. CRUX下实现进程隐藏(3)
  3. Python 技术篇-使用pygame库展示界面添加图片不显示问题解决办法
  4. 沈向洋谈做研究的那些事儿
  5. 高效、易用、功能强大的 api 管理平台(内附彩蛋)
  6. Windows10远程报错:由于CredSSP加密Oracle修正
  7. 公司服务器文件保存出错,R服务器错误保存文件没有这样的文件或目录(Ubuntu)...
  8. 数据结构期末复习(四)
  9. 基于 Keras 用 LSTM 网络做时间序列预测
  10. 前端能读取压缩包内容吗?_移动硬盘出现无法读取数据还能恢复吗?
  11. Easyui--官网
  12. JavaScript中常用的的字符串方法总结+详解
  13. 各种数据类型的取值范围
  14. Mac系统安装软件的三种方式
  15. bootstrap table获取表格数据方式
  16. 基于ffmpeg+opengl+opensl es的android视频播放器
  17. “九”答不可 | 量子通信如何做到安全保密?
  18. UiPath自动化机器人有关版本问题解决和Robot连接到Orchestrator
  19. node重新加入error execution phase kubelet-start: error uploading crisocket: Unauthorized
  20. Android悬浮菜单按钮FloatingActionButton实现

热门文章

  1. 腾讯终面:孤单的QQ号码怎么找?
  2. ZYNQ-AX7020学习笔记
  3. extjs grid选择框默认全选_Extjs gridpanel 加入全选列
  4. 马化腾对C语言的重视
  5. 转载一篇关于泰迪很好的文章
  6. 国际数学日 | 有π的日子,来一场数学派对
  7. 演算法 - 分治法(Divide-and-Conquer)
  8. html5如何实现无序排列,无序列表让li横排
  9. html如何在图片中放入音乐,如何给图片添加音乐
  10. CES Aisa总结篇|盛况依旧,却始终缺了点新意和真实落地的感觉