许多简单的概率分布在机器学习的众多领域中都非常有用,这个内容将分为两个部分来说明,第一个部分介绍伯努利分布、二项式分布、多项式分布及范畴分布,第二个部分介绍高斯分布、指数分布、Laplace分布、Dirac分布、经验分布及混合分布。

伯努利(Bernoulli)分布

伯努利分布是一种离散分布,有两种可能的结果:

  • 1表示成功,出现的概率为ppp(其中0<p<10 \lt p \lt 10<p<1)。
  • 0表示失败,出现的概率为q=1−pq=1-pq=1−p。

这种分布在机器学习中很有用,比如正面或反面,成功或失败,有缺陷或没有缺陷,病人康复或未康复。
可以用数学描述为:随机变量xxx只取0和1两个值,其概率为:

  • P(x=1)=pP(x = 1) = pP(x=1)=p, P(x=0)=1−p=qP(x = 0) = 1 - p = qP(x=0)=1−p=q

数学期望和方差计算如下:

  • E(x)=1∗p+0∗q=pE(x) = 1 * p + 0 * q = pE(x)=1∗p+0∗q=p
  • E(x2)=12∗p+02∗q=pE(x^2) = 1^2 * p + 0^2 * q = pE(x2)=12∗p+02∗q=p
  • D(x)=E(x2)−[E(x)]2=p−p2=p(1−p)=pqD(x) = E(x^2) - [E(x)]^2 = p - p^2 = p(1-p) = pqD(x)=E(x2)−[E(x)]2=p−p2=p(1−p)=pq

二项式(Binomial)分布

在nnn次独立重复的伯努利试验中,设每次试验成功的概率为ppp。用xxx表示nnn重伯努利试验中成功的次数,则xxx取值为{0,1,…,n}\{0, 1, \dots, n\}{0,1,…,n}中的一个。
对每一个k(0≤k≤n)k(0 \le k \le n)k(0≤k≤n),事件{x=k}\{x=k\}{x=k}表示“nnn次试验成功恰好发生kkk次”,随机变量xxx的离散概率分布即为二项分布(Binomial Distribution)。
典型例子为:扔硬币,硬币正面朝上概率为ppp, 重复扔nnn次硬币,kkk次为正面的概率即为一个二项分布概率。
用概率表示如下:

  • P(x=k)=n!k!(n−k)!pk(1−p)n−kP(x = k) = \frac{n!}{k!(n-k)!}p^k(1-p)^{n-k}P(x=k)=k!(n−k)!n!​pk(1−p)n−k

下图为不同参数下的二项式分布的图形:

多项式(Multinomial)分布

多项式分布是二项式分布的推广。将二项式分布推广至多种状态,就得到了多项式分布。举例说明如下:

  • 二项式分布:扔硬币,硬币正面朝上概率为ppp, 重复扔nnn次硬币,kkk次为正面的概率。
  • 多项式分布:扔骰子,不同于扔硬币,骰子有6个面对应6个不同的点数,这样单次每个点数朝上的概率都是16\frac{1}{6}61​(对应p1p_1p1​~p6p_6p6​,它们的值不一定都是16\frac{1}{6}61​,只要和为1且互斥即可,比如一个形状不规则的骰子),重复扔nnn次,如果问有kkk次都是点数6朝上的概率。

更一般化的描述如下:投掷nnn次骰子,这个骰子共有6种结果输出,1点出现概率为p1p_1p1​,2点出现概率p2p_2p2​,…\dots…;多项式分布给出了在nnn次试验中,骰子1点出现k1k_1k1​次,2点出现k2k_2k2​次,3点出现k3k_3k3​次,…,6点出现k6k_6k6​次。这个结果组合的概率为:
f(k1,k2,…,k6;n,p1,p2,…,p6)f(k_1, k_2, \dots, k_6;n, p_1, p_2, \dots, p_6)f(k1​,k2​,…,k6​;n,p1​,p2​,…,p6​)
=P(x1=k1,x2=k2,…,x6=k6)= P(x_1= k_1, x_2= k_2, \dots, x_6= k_6)=P(x1​=k1​,x2​=k2​,…,x6​=k6​)
=n!k1!k2!…k6!p1k1p2k2…p6k6= \frac{n!}{k_1!k_2! \dots k_6!}p_1^{k_1}p_2^{k_2} \dots p_6^{k_6}=k1​!k2​!…k6​!n!​p1k1​​p2k2​​…p6k6​​,
约束条件为∑i=16ki=n\sum_{i=1}^{6} k_i = n∑i=16​ki​=n.
为了更加简化,用Γ\GammaΓ函数来表示:
f(k1,k2,…,k6;n,p1,p2,…,p6)f(k_1, k_2, \dots, k_6;n, p_1, p_2, \dots, p_6)f(k1​,k2​,…,k6​;n,p1​,p2​,…,p6​)
=Γ(∑i=16ki+1)∏i=16Γ(ki+1)∏i=16piki=\frac{\Gamma(\sum_{i=1}^{6}k_i + 1)}{\prod_{i = 1}^{6}\Gamma(k_i + 1)}\prod_{i = 1}^{6}p_i^{k_i}=∏i=16​Γ(ki​+1)Γ(∑i=16​ki​+1)​∏i=16​piki​​.
【例题-1】同时投掷5枚骰子,投掷出2个一点,2个二点,1个三点的概率是多大?
【解答】
x1x_1x1​~x6x_6x6​表示6个点的出现次数之和为n=5n = 5n=5,利用多项式分布组合概率公式有:
P(x1=2,x2=2,x3=1,x4=0,x5=0,x6=0)P(x_1= 2, x_2= 2, x_3 = 1, x_4 = 0, x_5 = 0, x_6= 0)P(x1​=2,x2​=2,x3​=1,x4​=0,x5​=0,x6​=0)
=5!2!2!1!0!0!0!(16)2(16)2(16)1(16)0(16)0(16)0=\frac{5!}{2!2!1!0!0!0!}(\frac{1}{6})^{2}(\frac{1}{6})^{2}(\frac{1}{6})^{1}(\frac{1}{6})^{0}(\frac{1}{6})^{0}(\frac{1}{6})^{0}=2!2!1!0!0!0!5!​(61​)2(61​)2(61​)1(61​)0(61​)0(61​)0
=51296=\frac{5}{1296}=12965​
【例题-2】同时投掷5枚骰子,出现两对点数一样的概率是多少?
【解答】
在【例题-1】的基础之上,需要考虑x1x_1x1​~x6x_6x6​,其中2个取2,1个取1有多少种?

x1x_1x1​ x2x_2x2​ x3x_3x3​ x4x_4x4​ x5x_5x5​ x6x_6x6​
2 2 1 0 0 0
2 0 2 1 0 0
…\dots… …\dots… …\dots… …\dots… …\dots… …\dots…

先从6个里面选择2个取2,再从4个里面选出1个取1,总共有C62C41=60C_6^2C_4^1 = 60C62​C41​=60种。
出现两对点数一样的概率为5∗601296\frac{5 * 60}{1296}12965∗60​ = 25108\frac{25}{108}10825​。

范畴(Categorical)分布

范畴分布又称为Multinoulli分布、类别分布,它是多项式分布的一个特例。
抛一次骰子,第xkx_kxk​面朝上的概率,这是Categorical分布。

小结:几种分布的关系

  • 将一个小球放入两个桶,令变量 xxx 为第一个桶里面有的小球个数,那么只有 0 个或者 1 个,服从伯努利分布;
  • 将 nnn个小球放入两个桶,令变量 xxx 为第一个桶里面的小球个数,那么最少可能有 0 个,最多可能有 nnn个,服从二项分布;
  • 将一个小球放入 kkk个桶,令变量 x={x1,x2,…,xk}x = \{x_1, x_2, \dots, x_k\}x={x1​,x2​,…,xk​} 为kkk个桶内的小球个数,xxx是一个One-hot形式的向量,因为这个小球只能在一个桶里面,服从Categorical分布;
  • 将 nnn个小球放入 kkk个桶,令变量 x={x1,x2,…,xk}x = \{x_1, x_2, \dots, x_k\}x={x1​,x2​,…,xk​} 为kkk个桶内的小球个数,xxx是一个向量,元素和为 nnn,服从多项分布。

深度学习(2)--常见概率分布(1)相关推荐

  1. 深度学习(2)--常见概率分布(2)

    上一部分介绍了伯努利分布.二项式分布.多项式分布以及范畴分布,这里将继续介绍高斯分布.指数分布.Laplace分布.Dirac分布.经验分布及混合分布. 高斯分布 高斯分布又称为正态分布,其图形为钟形 ...

  2. 上手!深度学习最常见的26个模型练习项目汇总

    作者:沧笙踏歌 转载自AI部落联盟(id:AI_Tribe) 今天更新关于常见深度学习模型适合练手的项目.这些项目大部分是我之前整理的,基本上都看过,大概俩特点:代码不长,一般50-200行代码,建议 ...

  3. 深度学习中常见的损失函数

    文章来源于AI的那些事儿,作者黄鸿波 2018年我出版了<TensorFlow进阶指南 基础.算法与应用>这本书,今天我把这本书中关于常见的损失函数这一节的内容公开出来,希望能对大家有所帮 ...

  4. ML之模型文件:机器学习、深度学习中常见的模型文件(.h5、.keras)简介、h5模型文件下载集锦、使用方法之详细攻略

    ML之模型文件:机器学习.深度学习中常见的模型文件(.h5..keras)简介.h5模型文件下载集锦.使用方法之详细攻略 目录 ML/DL中常见的模型文件(.h5..keras)简介及其使用方法 一. ...

  5. 深度学习中常见的打标签工具和数据集资源

    深度学习中常见的打标签工具和数据集资源 一.打标签工具 1. labelimg/labelme 1.1 搭建图片标注环境(win10) (1) 安装anaconda3 (2) 在anaconda环境p ...

  6. 深度学习计算机视觉常见的29道面试题及解析

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 作者丨我要鼓励娜扎@知乎 来源丨https://zhuanlan.zhihu.com/p/89 ...

  7. 【深度学习】常见优化器的PyTorch实现

    这里主要讲不同常见优化器代码的实现,以及在一个小数据集上做一个简单的比较. 备注:pytorch需要升级到最新版本 其中,SGD和SGDM,还有Adam是pytorch自带的优化器,而RAdam是最近 ...

  8. 计算机视觉领域还有那些坑,深度学习/计算机视觉常见的8个错误总结及避坑指南...

    人类并不是完美的,我们经常在编写软件的时候犯错误.有时这些错误很容易找到:你的代码根本不工作,你的应用程序会崩溃.但有些 bug 是隐藏的,很难发现,这使它们更加危险. 在处理深度学习问题时,由于某些 ...

  9. 【语义分割】深度学习中常见概念回顾(全大白话解释,一读就能懂!)

    记录一下常见的术语! 一.epoch.batch size和iteration 1.1 Epoch 定义:一个epoch指代所有的数据送入网络中完成一次前向计算及反向传播的过程.简而言之:训练集中的全 ...

最新文章

  1. geoserver 通过代码实现发布地图服务
  2. 惠普电脑怎么截屏_省钱上京东双十一买笔记本电脑怎么买更优惠更划算更省钱最新攻略!联想戴尔华硕炫龙荣ROG神州宏碁惠普...
  3. 【深度学习】90.94%准确率!谷歌刷新ImageNet新纪录!Model soups:提高模型的准确性和稳健性...
  4. 经典C语言程序100例之六五
  5. Jmeter(二)关联
  6. java 备份 mysql 日志_MySQL 数据备份与还原
  7. a*算法流程图_B端产品如何画好流程图?
  8. 深度神经进化大有可为?Uber详解如何用它优化强化学习 | 5篇论文
  9. 在远程系统上开发 SharePoint 应用程序
  10. ASP.NET MVC HandleErrorAttribute 和 远程链接
  11. 音视频SDP协议介绍(rtsp,sip)
  12. win10添加组策略命令
  13. 织梦域名后缀.html,织梦cms建站教程之首页域名后缀index.html去除的方法
  14. 【机器人学】机器人开源项目KDL源码学习:(10)KDL中的OOP思想---继承
  15. Java利用递归算法实现24点游戏
  16. C语言按行读文件与读文件中每一个字符
  17. 手机影像内卷几时休?
  18. 等保测评师-等保测评工程师-发展路线(不喜勿喷)
  19. mysql下载64位 太平洋,Win10 64位安装MySQL5.6.35的详细教程
  20. 这里有五种身份证提取出生年月的格式

热门文章

  1. python分类下取得所有子类_如何找到给定名称的类的所有子类?
  2. 服务器补丁 系统,操作系统补丁服务器
  3. linux expect 扩容磁盘,openstack VM 磁盘扩容,修复 GPT 分区,更新分区表后,拉伸文件系统...
  4. 服务动态选择域名问题
  5. MagicRecord For IOS API深层解析
  6. python建立列表并输入_python操作列表
  7. java selenium_selenium 常见面试题以及答案(Java版)
  8. java 俄文,俄文字体在word里面是什么
  9. hibernate 批量更新_360产品动态,10月份平台都有哪些更新?
  10. 【LeetCode笔记】33. 搜索旋转排序数组(Java、二分法)