原址

非常有必要搞清楚统计学种一些常用的分布!!!

离散型随机变量分布

1.两点分布/伯努利分布

伯努利分布是二项分布在n=1时的特例。一次随机试验,成功概率为p,失败概率为q=1-p。

伯努利分布

2.二项分布

二项分布(Binomial distribution)是n重伯努利试验成功次数的离散概率分布。

二项分布的典型例子是扔硬币,硬币正面朝上概率为p, 重复扔n次硬币,k次为正面的概率即为一个二项分布概率。

二项分布

3.超几何分布

对N件产品(其中M件次品)进行不放回抽样,在n次抽样种抽到次品数X,服从超几何分布。

超几何分布

4.几何分布

X记首次成功的概率,服从几何分布。

5.负二项分布

X记第k次成功时总的实验次数,当k=1时,为几何分布。

“二项分布”是固定试验总次数N的独立试验中,成功次数k的分布;而“负二项分布”是所有到成功r次时即终止的独立试验中,失败次数k的分布。

负二项分布

Negative binomial distribution

负二项回归模型的统计推断

例子:

Pat is required to sell candy bars to raise money for the 6th grade field trip. There are thirty houses in the neighborhood, and Pat is not supposed to return home until five candy bars have been sold. So the child goes door to door, selling candy bars. At each house, there is a 0.4 probability of selling one candy bar and a 0.6 probability of selling nothing.

What's the probability of selling the last candy bar at the nth house?

6.泊松分布

有些事件,我们可以预估这些事件的总数,但是没法知道具体的发生时间。

如:已知平均每小时出生3个婴儿,请问下一个小时,会出生几个?

如:已知所有cell中reads的总数,相当于知道均值,问下一个细胞的reads数是多少。

这些从常理上看,我们会归为均匀分布,但现实就是泊松分布。

泊松分布和指数分布:10分钟教程

如何理解泊松分布和泊松过程

连续型随机变量分布

1.均匀分布

2.指数分布

指数分布是事件的时间间隔的概率。

3.正态分布

反应误差的最重要的分布,确定了均值和标准差就能确定一种正态分布。

参考:

伯努利分布、二项分布、多项分布、Beta分布、Dirichlet分布

负二项分布为什么叫这个名字?“负”从何而来?

数字特征

1.期望

相当于平均值

2.方差

就是方差

3.协方差

所以,我们可以定义一个表示X, Y 相互关系的数字特征,也就是协方差

cov(X, Y) = E(X-EX)(Y-EY)。

当 cov(X, Y)>0时,表明 X与Y 正相关;

当 cov(X, Y)<0时,表明X与Y负相关;

当 cov(X, Y)=0时,表明X与Y不相关。

这就是协方差的意义。

终于明白协方差的意义了

4.相关系数

翻译一下:就是用X、Y的协方差除以X的标准差和Y的标准差。

所以,相关系数也可以看成协方差:一种剔除了两个变量量纲影响、标准化后的特殊协方差。

如何通俗易懂地解释「协方差」与「相关系数」的概念?

5.矩

原点矩

中心矩

其他数字特征

中位数

分位数

众数

变异系数:将离散程度标准化,等于均值除以方差

偏态系数

峰态系数

大数定律

如果实验次数足够大,样本均值就会趋近于总体的期望

好吧,学概率的时候,我们总有一种潜在的潜在的观念

——当数很大的时候平均值,就是期望值。

比如,我们投骰子,如果我们投100次,求出现的数的平均,我们觉得会差不多是(1+6)/2=3.5 因为我们按照期望计算,算出来就是3.5。

但是,这是我们一个假定,我们还需要论证,为什么当数很大的时候,平均值就是期望值呢?  这就是大数定理证明了的了。

中心极限定理

大量相互独立的随机变量,其均值(或者和)的分布以正态分布为极限(意思就是当满足某些条件的时候,比如Sample Size比较大,采样次数区域无穷大的时候,就越接近正态分布)。而这个定理amazing的地方在于,无论是什么分布的随机变量,都满足这个定理。

怎样理解和区分中心极限定理与大数定律?

统计学常见分布、概念相关推荐

  1. 机器学习数学基础:常见分布与假设检验

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:吴忠强,Datawhale优秀学习者,东北大学 所谓机器学习和深 ...

  2. 概率统计基础(三):常见分布与假设检验

    这次概率统计学习基于:Datawhale概率统计组队学习文档 1. 写在前面 这次借着在Datawhale组织的概率统计专题学习的机会再重新温习一遍数学基础,所谓机器学习和深度学习, 背后的逻辑都是数 ...

  3. 概率统计(三)常见分布与假设检验

    常见分布与假设检验 一.一般随机变量 二.常见分布 1.离散型分布 (1)二项分布 (2)泊松分布 (3)几何分布 (4)负二项分布 (5)超几何分布 2.连续型分布 (1)均匀分布 (2)正态分布 ...

  4. 缓存中常见的概念及解决方案

    缓存中常见的概念及解决方案 缓存穿透 1.概念 用户查询数据,在数据库中以及缓存中(redis)都查询不到,导致每次请求来时,缓存(redis)中查询一次,数据库查询一次,最后返回空,每次请求都会有俩 ...

  5. 数据挖掘之数理统计与常见分布与假设检验

    1 一般随机变量 1.1 随机变量的两种类型 根据随机变量可能取值的个数分为离散型(取值有限)和连续型(取值无限)两类. 1.2 离散型随机变量 对于离散型随机变量,使用概率质量函数(probabil ...

  6. socket编程中常见的概念问题!

    socket编程一般指的就是网络编程,常见的服务端和客户机都是必不可少的,今天小千就来给大家介绍一下socket编程中常见的概念问题. 一.常见传输协议 1.tcp协议 TCP (Transmissi ...

  7. python所有算法_Python实现的各种常见分布算法示例

    本文实例讲述了Python实现的各种常见分布算法.分享给大家供大家参考,具体如下: #-*- encoding:utf-8 -*- import numpy as np from scipy impo ...

  8. 方差,协方差 、统计学的基本概念

    一.统计学的基本概念 统计学里最基本的概念就是样本的均值.方差.标准差.首先,我们给定一个含有n个样本的集合,下面给出这些概念的公式描述: 均值: 标准差: 方差: 均值描述的是样本集合的中间点,它告 ...

  9. 计算机网络中 89 个常见的概念

    计算机网络中 89 个常见的概念 主机:计算机网络上任何一种能够连接网络的设备都被称为主机或者说端系统,比如手机.平板电脑.电视.游戏机.汽车等,随着 5G 的到来,将会有越来越多的终端设备接入网络. ...

最新文章

  1. centos7 安装apache+php+memcache
  2. 【动态数组】数据结构01-(java实现)
  3. 牛客网-斐波那契数列
  4. 505B. Mr. Kitayuta‘s Colorful Graph
  5. 1.three.js世界的4大要素
  6. 从零手动实现简易Tomcat
  7. Entity Framework 4 in Action读书笔记——第四章:使用LINQ to Entities查询:排序和连接数据...
  8. mysql int类型 int(11) 和int(2)区别
  9. keras 多分类一些函数参数设置
  10. 14个PLC入门基础知识
  11. indexOf用法小结
  12. 回声消除(AEC)初体验之matlab仿真
  13. 香帅的北大金融学课笔记13 -- 投资决策
  14. 利用云服务器发布项目
  15. npm 使用淘宝镜像及切换回官方源
  16. tmap的使用_(转载)UE4容器TArray、TMap的使用
  17. Efforts should be valuable
  18. 邮票面值设计java,[蓝桥杯][算法提高VIP]邮票面值设计 (C++代码)
  19. nginx安全下载模块ngx_http_secure_link_module
  20. python绘制科赫曲线_python中使用递归实现koch曲线绘制

热门文章

  1. Nodejs基础:路径处理模块path总结
  2. backbone学习笔记:集合(Collection)
  3. 从化工技术员到微软最有价值专家(MVP)--我的IT从业路
  4. InfoPath中repeationg section动态填充数据
  5. 一起谈.NET技术,C#中的lock关键字
  6. 复数矩阵Cholesky分解算法的C++实现
  7. BP神经网络参数设置及实例
  8. MATLAB 中BP神经网络算法用于回归拟合的实现
  9. 【深度学习】循环神经网络(RNN)的tensorflow实现
  10. 前端怎么携带cookie发送php,PHP如何执行传递cookie的http请求并将结果保存到字符串...