统计学中常见的分布汇总及相关概念
常见分布
统计学中有很多常见的分布,在此对这些分布进行梳理。
离散型随机变量分布
1.离散型均匀分布
若随机变量有n个不同值,具有相同概率,则我们称之为离散均匀分布,通常发生在我们不确定各种情况发生的机会,且认为每个机会都相等,例如:投掷骰子等.
离散型均匀分布
离散型均匀分布-维基百科
2.两点分布/伯努利分布
伯努利分布是二项分布在n=1时的特例。一次随机试验,成功概率为p,失败概率为q=1-p。
伯努利分布
3.二项分布
二项分布是n重伯努利试验成功次数的离散概率分布。
二项分布的典型例子是扔硬币,硬币正面朝上概率为p, 重复扔n次硬币,k次为正面的概率即为一个二项分布概率。
二项分布
4.超几何分布
对N件产品(其中M件次品)进行不放回抽样,在n次抽样中抽到次品数X,服从超几何分布。
超几何分布
5.几何分布
对N件产品(其中M件次品)进行不放回抽样,在n次抽样中抽到次品数X,X记首次成功的概率,服从几何分布。
几何分布
6.泊松分布
有些事件,我们可以预估这些事件的总数,但是没法知道具体的发生时间。
如,已知平均每小时出生3个婴儿,请问下一个小时,会出生几个?
泊松分布
连续型随机变量分布
1.连续型均匀分布
均匀分布是指闭区间 [a, b] 内的随机变量,且每一个变量出现的概率是相同的。
连续型均匀分布
2.指数分布
指数分布是事件的时间间隔的概率。
如,婴儿出生的时间间隔。
指数分布
3.正态分布
反应误差的最重要的分布,确定了均值和标准差就能确定一种正态分布。
当正态分布的均值为 0、方差为 1 的时候,它就是标准正态分布,这也是我们最常用的分布。
正态分布
4.t分布
t-分布(Student t-distribution)用于根据小样本来估计呈正态分布且变异数未知的总体,其平均值是多少。
t 分布的长尾占比更多,这意味着 t 分布更容易产生远离均值的样本。
学生t-分布
5.卡方分布
卡方分布(Chi-squared)可以理解为,k 个独立的标准正态分布变量的平方和服从自由度为 k 的卡方分布。
卡方分布
6.F分布
F分布是由2个卡方分布构造的,而卡方分布一般用于度量样本方差和误差之和。所以引出F分布的三个重要应用:两个正态总体的抽样分布、方差分析、回归分析。
数据统计基础之F分布及其应用
F分布及其分布
数字特征
1.期望
相当于平均值。
2.方差
就是方差。
3.协方差
定义表示X, Y 相互关系的数字特征,即协方差。
cov(X, Y) = E(X-E(X))(Y-E(Y))。
当 cov(X, Y)>0时,表明 X与Y 正相关;
当 cov(X, Y)<0时,表明X与Y负相关;
当 cov(X, Y)=0时,表明X与Y不相关。
4.相关系数
用X、Y的协方差除以X的标准差和Y的标准差。
相关系数也可以看成协方差:剔除了两个变量量纲影响、标准化后的特殊协方差。
5.数据的概括性度量
1.集中趋势的度量
中位数,均值,众数
2.离散程度的度量
- 分类数据:异众比率
- 顺序数据:四分位差
- 数值型数据:方差和标准差
1.极差
2.平均差
3.方差和标准差
4.相对位置的度量- 标准分数
- 经验法则
- 切比雪夫不等式
- 相对离散程度:离散系数
3.偏态与峰态的度量
偏态系数
峰态系数
大数定律
大数定律:如果实验次数足够大,样本均值就会趋近于总体的期望。
比如,我们投骰子,如果我们投100次,求出现的数的平均,我们觉得会差不多是(1+6)/2=3.5 因为我们按照期望计算,算出来就是3.5。
大数定律
中心极限定理
当满足某些条件的时候,比如样本量比较大,采样次数区域无穷大的时候,样本均值就越接近正态分布。
中心极限定理
文章参考
https://baijiahao.baidu.com/s?id=1645256431232755893&wfr=spider&for=pc
https://www.cnblogs.com/leezx/p/7340045.html
统计学中常见的分布汇总及相关概念相关推荐
- python 绘制分布直方图_统计学中常见的4种抽样分布及其分布曲线(Python绘制)...
现代统计学奠基人之一.英国统计学家费希尔(Fisher)曾把抽样分布.参书估计和假设检验看作统计推断的三大中心内容. 统计学中,需要研究统计量的性质,并评价一个统计推断的优良性,而这些取决于其抽样分布 ...
- 数据分析(1)——统计学中的各种分布
数据分析(1)--统计学中的各种分布 1. 离散概率分布 1.1 二项分布 1.1.1 二项分布的定义及其公式 1.1.2 二项分布的性质(适用情况) 1.1.3 例题 1.2 伯努利分布 1.2.1 ...
- 机器学习中常见性能度量汇总
前言 如果你对这篇文章感兴趣,可以点击「[访客必读 - 指引页]一文囊括主页内所有高质量博客」,查看完整博客分类与对应链接. 一.回归 在回归任务上,目前最常用的性能度量方式是均方误差 (Mean S ...
- UIView中常见的方法汇总
addSubview: 添加一个子视图到接收者并让它在最上面显示出来. - (void)addSubview:(UIView *)view 总结:这个方法同样设置了接收者为下一个视图响应对象.接收 ...
- 开发中常见的算法汇总之-基数排序
#### 基数排序 - 核心思想 - 基于桶排序模式,选择一定的桶数量,对待排序数据进行按位数先分割,从低位向高位依次进行轮流入桶出桶操作排序 - 基于**分治算法思想**,对元素进行分配至对应的桶中 ...
- 积分管理制度中常见的问题汇总
积分管理制度随着互联网的推动,在中小企业老板中开始广为盛行,商家们在互相学习的过程中渐渐地启用积分管理制度,那么问题来了,究竟什么是积分管理制度?积分管理制度有什么好处?为什么企业要用积分管理制度?积 ...
- 一.统计学中常见的几种统计资料
1.计量资料:采用定量的方法测定调查对象的结局指标获得数据称为计量资料.如高血压患者的血压监测数据(120mmHg,125mmHg,126mmHg,127mmHg):糖尿病患者的血糖测量值(7.1mm ...
- PMP考试中常见敏捷知识点汇总
一.Scrum框架的3355 不要求完全能背,重要的是理解. Scrum框架有3个角色,3个工件,5个事件,5个价值观,简称3355. 3个角色: 产品负责人PO(Product Onwer) 开发团 ...
- Python基础071:人工智能中常见的术语汇总
1.同质数据.异构数据 同质数据:数据类型一样的数据的集合 异构数据:数据类型不一样的数据的集合 注:数据类型一般有,int .float .string.bool等
最新文章
- pringboot 单元测试 空指针_单元测试中的 FIRST 原则
- asp程序错误详细说明例表
- Matlab篇(二)MATLAB中addpath的用法 (转)
- 2021- 10 -13 AVL树的平衡调整(有parent指针) 代码逻辑
- C语言学习之输入两个正整数m和n,求其最大公约数和最小公倍数。
- 【机器视觉】 case算子
- Java集合框架:LinkedHashMap
- 【Ogre-windows】旋转矩阵及位置解析
- [react-router] React-Router 4中<Router>组件有几种类型?
- ExtJs 备忘录(4)—— Form表单(四) [ 数据提交 ]
- sharepoint被阻止的文件类型解释说明
- shell处理curl返回数据_linux shell中curl 发送post请求json格式问题的处理方法
- spark代码中添加logger_JAVA代码如何设置SPARK的日志打印级别
- PC-hosts 的使用 [可使电脑无法正常上网]
- 74HC138 三八译码器
- 深入理解JavaI/O流
- CDH5: 使用parcels配置lzo
- 个人开公司的流程及费用
- 【一起读源码】1. Java 中元组 Tuple
- POJ - Frogs' Neighborhood(Havel-Hakimi)