常见分布

统计学中有很多常见的分布,在此对这些分布进行梳理。

离散型随机变量分布

1.离散型均匀分布

若随机变量有n个不同值,具有相同概率,则我们称之为离散均匀分布,通常发生在我们不确定各种情况发生的机会,且认为每个机会都相等,例如:投掷骰子等.
离散型均匀分布
离散型均匀分布-维基百科

2.两点分布/伯努利分布

伯努利分布是二项分布在n=1时的特例。一次随机试验,成功概率为p,失败概率为q=1-p。
伯努利分布

3.二项分布

二项分布是n重伯努利试验成功次数的离散概率分布。

二项分布的典型例子是扔硬币,硬币正面朝上概率为p, 重复扔n次硬币,k次为正面的概率即为一个二项分布概率。
二项分布

4.超几何分布

N件产品(其中M件次品)进行不放回抽样,在n次抽样中抽到次品数X,服从超几何分布。
超几何分布

5.几何分布

N件产品(其中M件次品)进行不放回抽样,在n次抽样中抽到次品数X,X记首次成功的概率,服从几何分布。
几何分布

6.泊松分布

有些事件,我们可以预估这些事件的总数,但是没法知道具体的发生时间。
如,已知平均每小时出生3个婴儿,请问下一个小时,会出生几个?

泊松分布

连续型随机变量分布

1.连续型均匀分布

均匀分布是指闭区间 [a, b] 内的随机变量,且每一个变量出现的概率是相同的。
连续型均匀分布

2.指数分布

指数分布是事件的时间间隔的概率。
如,婴儿出生的时间间隔。
指数分布

3.正态分布

反应误差的最重要的分布,确定了均值和标准差就能确定一种正态分布。
当正态分布的均值为 0、方差为 1 的时候,它就是标准正态分布,这也是我们最常用的分布。
正态分布

4.t分布

t-分布(Student t-distribution)用于根据小样本来估计呈正态分布且变异数未知的总体,其平均值是多少。
t 分布的长尾占比更多,这意味着 t 分布更容易产生远离均值的样本。
学生t-分布

5.卡方分布

卡方分布(Chi-squared)可以理解为,k 个独立的标准正态分布变量的平方和服从自由度为 k 的卡方分布。
卡方分布

6.F分布

F分布是由2个卡方分布构造的,而卡方分布一般用于度量样本方差和误差之和。所以引出F分布的三个重要应用:两个正态总体的抽样分布、方差分析、回归分析。
数据统计基础之F分布及其应用
F分布及其分布

数字特征

1.期望

相当于平均值。

2.方差

就是方差。

3.协方差

定义表示X, Y 相互关系的数字特征,即协方差。

cov(X, Y) = E(X-E(X))(Y-E(Y))。

当 cov(X, Y)>0时,表明 X与Y 正相关;
当 cov(X, Y)<0时,表明X与Y负相关;
当 cov(X, Y)=0时,表明X与Y不相关。

4.相关系数


用X、Y的协方差除以X的标准差和Y的标准差。

相关系数也可以看成协方差:剔除了两个变量量纲影响、标准化后的特殊协方差

5.数据的概括性度量

1.集中趋势的度量

中位数,均值,众数

2.离散程度的度量

  • 分类数据:异众比率
  • 顺序数据:四分位差
  • 数值型数据:方差和标准差
    1.极差
    2.平均差
    3.方差和标准差
    4.相对位置的度量

    • 标准分数
    • 经验法则
    • 切比雪夫不等式
  • 相对离散程度:离散系数

3.偏态与峰态的度量

偏态系数

峰态系数

大数定律

大数定律:如果实验次数足够大,样本均值就会趋近于总体的期望。

比如,我们投骰子,如果我们投100次,求出现的数的平均,我们觉得会差不多是(1+6)/2=3.5 因为我们按照期望计算,算出来就是3.5。

大数定律

中心极限定理

当满足某些条件的时候,比如样本量比较大,采样次数区域无穷大的时候,样本均值就越接近正态分布。
中心极限定理

文章参考

https://baijiahao.baidu.com/s?id=1645256431232755893&wfr=spider&for=pc

https://www.cnblogs.com/leezx/p/7340045.html

统计学中常见的分布汇总及相关概念相关推荐

  1. python 绘制分布直方图_统计学中常见的4种抽样分布及其分布曲线(Python绘制)...

    现代统计学奠基人之一.英国统计学家费希尔(Fisher)曾把抽样分布.参书估计和假设检验看作统计推断的三大中心内容. 统计学中,需要研究统计量的性质,并评价一个统计推断的优良性,而这些取决于其抽样分布 ...

  2. 数据分析(1)——统计学中的各种分布

    数据分析(1)--统计学中的各种分布 1. 离散概率分布 1.1 二项分布 1.1.1 二项分布的定义及其公式 1.1.2 二项分布的性质(适用情况) 1.1.3 例题 1.2 伯努利分布 1.2.1 ...

  3. 机器学习中常见性能度量汇总

    前言 如果你对这篇文章感兴趣,可以点击「[访客必读 - 指引页]一文囊括主页内所有高质量博客」,查看完整博客分类与对应链接. 一.回归 在回归任务上,目前最常用的性能度量方式是均方误差 (Mean S ...

  4. UIView中常见的方法汇总

    addSubview:  添加一个子视图到接收者并让它在最上面显示出来.  - (void)addSubview:(UIView *)view 总结:这个方法同样设置了接收者为下一个视图响应对象.接收 ...

  5. 开发中常见的算法汇总之-基数排序

    #### 基数排序 - 核心思想 - 基于桶排序模式,选择一定的桶数量,对待排序数据进行按位数先分割,从低位向高位依次进行轮流入桶出桶操作排序 - 基于**分治算法思想**,对元素进行分配至对应的桶中 ...

  6. 积分管理制度中常见的问题汇总

    积分管理制度随着互联网的推动,在中小企业老板中开始广为盛行,商家们在互相学习的过程中渐渐地启用积分管理制度,那么问题来了,究竟什么是积分管理制度?积分管理制度有什么好处?为什么企业要用积分管理制度?积 ...

  7. 一.统计学中常见的几种统计资料

    1.计量资料:采用定量的方法测定调查对象的结局指标获得数据称为计量资料.如高血压患者的血压监测数据(120mmHg,125mmHg,126mmHg,127mmHg):糖尿病患者的血糖测量值(7.1mm ...

  8. PMP考试中常见敏捷知识点汇总

    一.Scrum框架的3355 不要求完全能背,重要的是理解. Scrum框架有3个角色,3个工件,5个事件,5个价值观,简称3355. 3个角色: 产品负责人PO(Product Onwer) 开发团 ...

  9. Python基础071:人工智能中常见的术语汇总

    1.同质数据.异构数据 同质数据:数据类型一样的数据的集合 异构数据:数据类型不一样的数据的集合 注:数据类型一般有,int .float .string.bool等

最新文章

  1. pringboot 单元测试 空指针_单元测试中的 FIRST 原则
  2. asp程序错误详细说明例表
  3. Matlab篇(二)MATLAB中addpath的用法 (转)
  4. 2021- 10 -13 AVL树的平衡调整(有parent指针) 代码逻辑
  5. C语言学习之输入两个正整数m和n,求其最大公约数和最小公倍数。
  6. 【机器视觉】 case算子
  7. Java集合框架:LinkedHashMap
  8. 【Ogre-windows】旋转矩阵及位置解析
  9. [react-router] React-Router 4中<Router>组件有几种类型?
  10. ExtJs 备忘录(4)—— Form表单(四) [ 数据提交 ]
  11. sharepoint被阻止的文件类型解释说明
  12. shell处理curl返回数据_linux shell中curl 发送post请求json格式问题的处理方法
  13. spark代码中添加logger_JAVA代码如何设置SPARK的日志打印级别
  14. PC-hosts 的使用 [可使电脑无法正常上网]
  15. 74HC138 三八译码器
  16. 深入理解JavaI/O流
  17. CDH5: 使用parcels配置lzo
  18. 个人开公司的流程及费用
  19. 【一起读源码】1. Java 中元组 Tuple
  20. POJ - Frogs' Neighborhood(Havel-Hakimi)

热门文章

  1. html表单制作及实例问卷好吗,问卷网上制作问卷、表单、测评的区别
  2. OpenSuSE 网络配置
  3. sql 获取一个周的周一和周日
  4. 关于遥感图像的控制点片匹配算法的一点想法(二)
  5. java中常见的数据结构分类
  6. C++实现调用C#(CLI)方法
  7. PhoneGap在Android上的插件开发方法介绍
  8. java中for 的几种常见用法
  9. 拼包函数及网络封包的异常处理
  10. XNA or Silverlight for Windows Phone 7 game