目录

  • 二项分布
    • 性质
  • 负二项分布
    • 性质
  • 示例
    • scipy 实现及可视化
    • 期望与方差

二项分布容易理解,负二项分布的描述不同模型稍有区别,记录一下。

二项分布

离散分布的一种,固定次数的独立试验时使用,每一次试验结果分为成功和失败两类,关心的是成功或失败的次数。

二项分布概率密度为:

P(X=k)=Cnkpkqn−k\large\displaystyle P(X=k)=C_n^k p^kq^{n-k}P(X=k)=Cnk​pkqn−k

其中:

  • p为单次试验成功的概率,q为失败的概率;
  • n为试验次数;
  • k表示成功k次,
    Cnk=n!k!(n−k)!\displaystyle C_n^k=\frac{n!}{k!(n-k)!}Cnk​=k!(n−k)!n!​。

性质

期望:E(x)=np\displaystyle E(x)=npE(x)=np

方差:Var(x)=npq\displaystyle Var(x)=npqVar(x)=npq

负二项分布

负二项分布有不同的描述,核心是放回抽取或者掷色子试验中,固定 成功(失败)的次数,描述 抽取/投掷 失败 (成功) 的次数概率分布。

scipy.stats描述的模型:
nbinom takes n and p as shape parameters where n is the number of successes, p is the probability of a single success, and (1-p) is the probability of a single failure.

负二项分布将n和p作为形状参数,其中n是成功的次数,p 是单个成功的概率,1-p 是单个失败的概率。

scipy中:
抽取试验,单次成功的概率为ppp,直到抽取nnn次成功结束,这种情况下,失败次数kkk符合负二项分布,其概率密度为:

P(X=k)=Cn+k−1n−1pn(1−p)k\displaystyle P(X=k)=C_{n+k-1}^{n-1}p^n(1-p)^kP(X=k)=Cn+k−1n−1​pn(1−p)k

陈希孺老师教材中:
抽取试验,单次成功的概率为ppp,抽取试验直到抽取kkk次失败结束,这种情况下,成功次数nnn符合负二项分布,

P(X=n)=Cn+k−1k−1pn(1−p)k\displaystyle P(X=n)=C_{n+k-1}^{k-1}p^n(1-p)^kP(X=n)=Cn+k−1k−1​pn(1−p)k

性质

以scipy.stats模型为例,
期望:E(X)=np−n=n(1−p)p\displaystyle E(X) =\frac{n}{p}-n = \frac{n(1-p)}{p}E(X)=pn​−n=pn(1−p)​
方差:Var(X)=n(1−p)p2\displaystyle Var(X)=\frac{n(1-p)}{p^2}Var(X)=p2n(1−p)​

示例

掷色子,掷出1点为胜利:

  • 构造投掷18次筛子,投出1点的次数符合二项分布;
  • 现在考虑掷出3次胜利,问需要掷出多少次色子,比如结果是掷出了 k+3次色子,则k的分布符合 负二项分布

scipy 实现及可视化

import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号fig, axs = plt.subplots(1,2,figsize=(10,4),dpi=100)
fig.subplots_adjust(wspace=0.3)
# 单次试验成功率
p = 1./6
# 二项分布考虑掷色子18次,成功次数符合二项分布
N = 18
# 负二项分布考虑掷出成功n次,失败次数符合二项分布
n = 3
# 二项分布B(N,p)
P_B= stats.binom(N,p)
## 成功次数0~18的概率分布
x=np.arange(N)
PF_B = P_B.pmf(x)# 负二项分布NB(n,p)
P_NB = stats.nbinom(n,p)
# 成功3次,失败次数 k 的概率分布
k=np.arange(N)
PF_NB = P_NB.pmf(k)axs[0].stem(x, PF_B, 'bo', label='固定总次数,成功次数: 二项分布')
axs[0].set_xticks(range(0,20,1));
axs[0].legend(loc='upper left')
axs[0].set_ylim(0,0.3)ax2=axs[0].twinx()
ax2.plot(x,P_B.cdf(x),'r',label='累积概率')
ax2.legend(loc='center right')
ax2.grid()
ax2.set_ylim(0,1.2)axs[1].stem(k, PF_NB, 'bo', label='固定成功次数,失败次数: 负二项分布')
axs[1].set_ylim(0,0.06)
axs[1].set_xticks(range(0,20,1));
axs[1].legend(loc='upper left')
ax2=axs[1].twinx()
ax2.plot(x,P_NB.cdf(x),'r',label='累积概率')
ax2.legend(loc=[0.02,0.8])
ax2.grid()

期望与方差

期望

print(f'二项分布的期望: {stats.binom(18,1./6).expect():.1f}, \n负二项分布的期望{stats.nbinom(3,1./6).expect():.1f}')

输出为

二项分布的期望: 3.0,
负二项分布的期望15.0

验算:
二项分布 binom(18,1./6) 的期望 E(X)=np=18∗1/6=3\displaystyle E(X) =np=18*1/6=3E(X)=np=18∗1/6=3
负二项分布**nbinom(3,1./6)**的期望 E(X)=np−n=3∗6−3=15\displaystyle E(X) =\frac{n}{p}-n = 3*6-3=15E(X)=pn​−n=3∗6−3=15 ,
方差

print(f'二项分布的方差: {stats.binom(18,1./6).var():.1f}, \n负二项分布的方差{stats.nbinom(3,1./6).var():.1f}')

二项分布**binom(18,1./6)的方差: 2.5,
负二项分布
nbinom(3,1./6)**的方差90.0

验算
二项分布 binom(18,1./6) 的方差E(X)=npq=18∗1/6∗5/6=2.5\displaystyle E(X) =npq=18*1/6*5/6=2.5E(X)=npq=18∗1/6∗5/6=2.5
负二项分布**nbinom(3,1./6)**的方差E(X)=n(1−p)p2=3∗5/6∗6∗6=90\displaystyle E(X) =\frac{n(1-p)}{p^2}=3*5/6*6*6=90E(X)=p2n(1−p)​=3∗5/6∗6∗6=90

二项分布与负二项分布卡片相关推荐

  1. 负二项分布学习[转载]

    转自:https://wenku.baidu.com/view/b6518ea5112de2bd960590c69ec3d5bbfd0adaff.html 1.伯努利实验 2.二项分布 3.负二项分布 ...

  2. 统计学基础——负二项分布的数字特征

    统计学基础--负二项分布的数字特征 一.引言 二.负二项分布定义的引出与理解 2.1 实际意义 2.2 初始定义 2.3 重新定义"负"二项分布 2.3 推导前的知识准备 三.数字 ...

  3. 统计学(1)二项分布 几何分布 泊松分布 指数分布 正态分布 gamma分布 beta分布

    分布与分布关系 1.二项分布 2.几何分布 3.泊松分布 4.二项分布转化泊松分布,泊松转化正态分布 5.指数分布 6.gamma分布 7.泊松.指数.gamma三者关系 8.Beta分布 1.二项分 ...

  4. 统计复习:伯努利分布、二项分布、几何分布、超几何分布、泊松分布

    伯努利分布.二项分布.几何分布.超几何分布.泊松分布都是离散型随机变量. 1 伯努利分布:就是常见的0-1 分布,各自的频率为1-p和p ,当x=0 或者x=1 的时候,: p(x) = 期望:    ...

  5. 系统学习机器学习之线性判别式(三)--广义线性模型(Generalized Linear Models)

    转自:https://www.cnblogs.com/czdbest/p/5769326.html 在线性回归问题中,我们假设,而在分类问题中,我们假设,它们都是广义线性模型的例子,而广义线性模型就是 ...

  6. r语言中popsd和sd的区别_读书笔记(R语言)

    R与ASReml-R统计分析教程(林元震)中国林业出版社 1-3章简单介绍了R的基本语法,然后第4章着重讲了各种统计方法,第5章讲R的绘图,最后一张讲ASReml-R这个包 语法重点: 1,insta ...

  7. 二元置信椭圆r语言_一般加性模型的简介、应用举例及R语言操作

    一般加性模型的简介.应用及R语言操作举例前文在"平滑回归举例"中,提到当未知自变量和响应变量间的关系,难以选择合适的参数模型描述二者间的响应状态,或者期望探索二者可能的响应曲线形式 ...

  8. R语言函数总结(转)

    R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头,第二个字符不允许是数字. 基本命令要么是表达 ...

  9. 一文总结SLAM中的深度滤波问题

    写在前面 本文会比较长,因为本身这部分就比较复杂,笔者自身加入了自己的一些思考和理解,不对的地方请及时指出,一同进步. Reference Semi-Dense Visual Odometry for ...

  10. R语言的各种统计分布函数

    转载自品略图书馆 http://www.pinlue.com/article/2018/09/1613/487222559948.html R语言的各种统计分布函数 1.二项分布Binomial di ...

最新文章

  1. 真相!30K拿到互联网大厂offer,网友:我服了!
  2. 如何判断 cxgrid 双击了哪一列_唐卡的价值主要体现在哪 如何判断唐卡的价值
  3. (How to)WordPress与Windows Live Writer整合
  4. java反序列化 exp_java反序列化-ysoserial-调试分析总结篇(4)
  5. linq to object 、linq to sql 、linq to entity 批量 新增、更新、删除功能扩展
  6. 【java reflection】反射工具类总结
  7. rocketmq 消息 自定义_RocketMQ消息轨迹-设计篇
  8. mysql卸载完环境变量还有_MySql完全卸载
  9. 霍金首次公开24岁时博士论文 把剑桥的服务器搞瘫痪了……
  10. 高桥盾react和boost_gel、react、boost三种材料的跑鞋,哪个更强呢?
  11. R学习笔记(4): 使用外部数据
  12. 关于时间格式的解析问题
  13. atitit.hbnt orm db 新新增更新最佳实践o7
  14. 通过dll来引用webservice的方法(.net)
  15. 人工智能教程1---科普人工智能
  16. Postman Collection Format v1 is no longer supported and can not be imported directly. You may conver
  17. 混血网站诞生 公司相互嫁接成就新商业模式
  18. jadx重新打包_反编译一款APP然后重新打包(Windows环境)
  19. mysql存储函数中游标报错 No data - zero rows fetched, selected
  20. Nodejs报内部错误 TypeError: Cannot read property ‘destroy‘ of undefined的解决方法

热门文章

  1. VCL语法教程——1.变量及labels
  2. 新版微信支持鸿蒙os,微信突然宣布!“新功能”全面爆发,鸿蒙OS措手不及
  3. lucas–kanade_Lucas–Kanade光流算法
  4. iOS 播放器静音设置方法
  5. 西雅图大学计算机专业,本科计算机专业伊力诺依香槟分校,华盛顿西雅图大学,德州奥斯汀哪个好??...
  6. [WP]第五届XMan选拔赛web
  7. 计算机网络对等网实验报告,计算机网络实验报告_双机互联
  8. python100个必备包_这套python教程超详细,包你1小时入门Python,100天摇身变大牛...
  9. php onblur=,onblur
  10. 颜色直方图匹配(一)