贝叶斯推理:概率分布

设定 ZZZ 是随机变量,与 Z" role="presentation" style="position: relative;">ZZZ 相关联的是概率分布函数。ZZZ 可以输出不同值,该函数则对各值赋于相应的概率。

随机变量 Z" role="presentation" style="position: relative;">ZZZ 有三种类型:

  • 离散型。例如货币、电影评级、选票数目等。
  • 连续型。例如温度、速度、时间等。
  • 混合型。 是上述两种变量的联合。

离散型变量的概率分布

离散变量 ZZZ 的分布叫做概率质量函数,以 P(Z=k)" role="presentation" style="position: relative;">P(Z=k)P(Z=k)P(Z = k) 表示。可见,ZZZ 由多个值 k" role="presentation" style="position: relative;">kkk 构成,并由该函数全面描述。知道了该函数就知道了 ZZZ 的行为。常用的概率质量函数有多个,其中一个非常有用的是泊松分布( Poisson-distributed ):

P(Z=k)=λke−λk!,k=0,1,2,..." role="presentation">P(Z=k)=λke−λk!,k=0,1,2,...P(Z=k)=λke−λk!,k=0,1,2,...

P( Z = k ) = \frac{\lambda^k e^{-\lambda} } { k!} ,k = 0,1,2,... λλ\lambda 叫做概率分布的参数,并控制着分布的形状。对于泊松分布,λλ\lambda 可为任意正数。增大 λλ\lambda 值,我们可以加大较大数值对应的概率;减小 λλ\lambda 值, 我们可以加大较小数值对应的概率。λλ\lambda 可视作泊松分布的密度。

与 λλ\lambda 不同,kkk 必须是正整数。这一点十分重要。因为,如果你建立人口模型,不会允许数据出现 4.25 或者 5.612 个人。

如果随机变量 Z" role="presentation" style="position: relative;">ZZZ 有泊松质量分布,则记作:

Z∼Poi(λ)Z∼Poi(λ)

Z ∼ Poi(λ) 泊松分布的一个有用的特点,是它的预期值等于它的参数值:

E[Z|λ]=λE[Z|λ]=λ

E[Z|λ] = λ 这个特点经常用到,应该记住它。
在图-1中,画出了不同 λλ\lambda 值的概率质量分布。首先, λλ\lambda 值的增大,会使较大数值对应的概率增大;其次,虽然 x 轴终止于15,但概率分布并未终止。每个正整数都有相应的正值的概率。

%matplotlib inline
from IPython.core.pylabtools import figsize
import numpy as np
from matplotlib import pyplot as plt
import scipy.stats as statsfigsize(12.5, 4)a = np.arange(16)poi = stats.poisson              # 泊松离散随机变量
lambda_ = [1.5, 4.25]            #λ参数colors = ["#348ABD", "#A60628"]
plt.bar(a, poi.pmf(a, lambda_[0]), color=colors[0],label="$\lambda = %.1f$" % lambda_[0], alpha=0.60,edgecolor=colors[0], lw="3")# poi.pmf: 数组 a 中各值的概率质量函数
plt.bar(a, poi.pmf(a, lambda_[1]), color=colors[1],label="$\lambda = %.1f$" % lambda_[1], alpha=0.60,edgecolor=colors[1], lw="3")
plt.xticks(a + 0.4, a) # 设置 x 轴刻度
plt.legend()
plt.ylabel("Probability of $k$")
plt.xlabel("$k$")
plt.title("Probability mass function of a Poisson random variable,\differing $\lambda$ values");

图-1

连续型变量的概率分布

与概率质量函数不同,连续随机变量有个概率密度函数。这两个函数极其不同。概率密度函数是指数型的,这般模样:

fZ(z|λ)=λe−λz,z≥0fZ(z|λ)=λe−λz,z≥0

fZ(z|λ) = λe^{−λz}, z ≥ 0
与泊松随机变量相同,指数型的随机变量也是只取正值。不同的是,它可以取分数,如 4.25 或 5.612401。这个特点使它不适合选择整数数据,而非常适合选择时间、温度(当然是绝对温度)或其他精确、正值的变量。图-2,表示2个不同 λλ\lambda 值的概率密度函数。
指数型的随机变量 ZZZ 带有参数 λ" role="presentation" style="position: relative;">λλλ,呈现指数型分布,记为:

Z∼Exp(λ)Z∼Exp(λ)

Z ∼ Exp(λ) 指数型随机变量的预期值,等于 λλ\lambda 的倒数:

E[Z|λ]=1λE[Z|λ]=1λ

E[Z|λ] =\frac{1}\lambda

%matplotlib inline
from IPython.core.pylabtools import figsize
import numpy as np
from matplotlib import pyplot as plt
import scipy.stats as statsa = np.linspace(0, 4, 100)
expo = stats.expon
lambda_ = [0.5, 1]
for l, c in zip(lambda_, colors):plt.plot(a, expo.pdf(a, scale=1./l), lw=3,color=c, label="$\lambda = %.1f$" % l)plt.fill_between(a, expo.pdf(a, scale=1./l), color=c, alpha=.33)
plt.legend()
plt.ylabel("Probability density function at $z$")
plt.xlabel("$z$")
plt.ylim(0,1.2)
plt.title("Probability density function of an exponential random\variable, differing $\lambda$ values");

图-2

重要的是要知道,概率密度函数在某点的值,与该点的概率值并不相等。

λλ\lambda 到底是什么?

在现实世界中,我们只能看到 ZZZ ,但看不到 λ" role="presentation" style="position: relative;">λλ\lambda。只能试图根据 ZZZ 确定 λ" role="presentation" style="position: relative;">λλ\lambda,但这很困难,因为二者没有逐一对应的值。人们创造了许多不同方法,以求解决评估 λλ\lambda 的问题。可是,由于从未有人真正观察到 λλ\lambda ,没人敢肯定哪个方法是最好的。
贝叶斯学派认为不要企图准确猜测 λλ\lambda ,而是仅限于为 λλ\lambda 设定分布概率,从而讨论它可能是什么。
看上去这很怪异。毕竟 λλ\lambda 的值是固定的,而不是、也不必是随机的。我们只能说,相信 λλ\lambda 的存在。

贝叶斯推理:概率分布相关推荐

  1. 统计学原理-----概率分布

    0.大纲: 1.什么是概率分布? 概率分布就是随机变量与对应概率关系的函数.换句话说,概率分布就是随机变量和概率的映射,所有的事件都会对应一个概率.某个随机变量的所有概率形成的概率-事件分布就是该随机 ...

  2. Python概率分布大全(含可视化)

    文章目录 术语 前言 整数 浮点数 抽取 字节 洗牌 排列 贝塔分布 二项分布 卡方分布 狄利克雷分布 指数分布 F分布 伽玛分布 几何分布 耿贝尔分布 超几何分布 拉普拉斯分布(双指数分布) 逻辑斯 ...

  3. 机器学习中贝叶斯判决、概率分布、样本等概念间的关系

    以下是在看模型识别,机器学习及数理统计时,对贝叶斯决策.概率分布.样本关系的总结,每想到一点就写下来,比较乱,这块需要反复学习.慢慢理解. 1. 机器学习的一些概念: 什么是机器学习? 机器学习包含哪 ...

  4. 【实例讲解】贝叶斯推理原理

    今天看论文的时候,看到了贝叶斯推理,搜索的时候,正巧搜到了一个大牛的博客,博客中对于贝叶斯推理的进阶实例讲解,真的是非常精彩,这里将自己对贝叶斯推理的收获记录下来.如有理解错误的地方,欢迎指正共同讨论 ...

  5. 实例详解贝叶斯推理的原理

    推理是一种精确的数据预测方式.在数据没有期望的那么多,但却想毫无遗漏地,全面地获取预测信息时非常有用. 提及贝叶斯推理时,人们时常会带着一种敬仰的心情.其实并非想象中那么富有魔力,或是神秘.尽管贝叶斯 ...

  6. 线性回归与贝叶斯推理——漫谈机器学习

    1. 从观察出发--回归问题 在统计学中,我们认为一个变量是服从某种理想分布的,称为理想变量.而为了获得理想变量的值,我们需要去观察这个世界,并得到观察数据,称为观察变量.观察变量与理想变量之间的函数 ...

  7. 一文读懂贝叶斯推理问题:MCMC方法和变分推断

    全文共6415字,预计学习时长20分钟或更长 图片来源:pexels.com/@lum3n-com-44775 贝叶斯推理(Bayesian inference)是统计学中的一个重要问题,也是许多机器 ...

  8. 贝叶斯推理三种方法:MCMC 、HMC和SBI

    对许多人来说,贝叶斯统计仍然有些陌生.因为贝叶斯统计中会有一些主观的先验,在没有测试数据的支持下了解他的理论还是有一些困难的.本文整理的是作者最近在普林斯顿的一个研讨会上做的演讲幻灯片,这样可以阐明为 ...

  9. 均匀分布取某一点概率_概率和概率分布

    概率与概率分布是统计学中的基础概念,在我们的高中的课本中就接触过了,如果有遗忘,一起来回顾一下吧! 知识点: 概率 概率分布 一.概率 说到概率,需要先了解一个概念,叫做随机试验.随机试验是指在相同条 ...

最新文章

  1. Java SE7新特性之switch语句中使用字符串
  2. python编程语言能干什么-python编程语言的优势与劣势--python能干啥
  3. idea redis 插件_Redis客户端RDM收费后,还有哪些开源的替代品呢?
  4. 技术与管理并重才能走的更远
  5. AutoMapper2
  6. ChaiNext:过去24小时,市场情绪“燥”
  7. Flutter 升级 2.0 填坑指导,带你原地起飞
  8. 软考历年真题以及真题试卷
  9. thinkpad X230 黑屏折腾
  10. Teamviewer远程工具使用
  11. 网站部署证书 百度浏览器仍提示不安全网站怎么办
  12. Python人脸识别 Python3.7+OpenCV+Dlib+罗技C920摄像头 实现离线实时摄像头画面人脸检测+识别
  13. 数学符号“s.t.”的意义
  14. 免费HTTP代理商如何
  15. oracle数据库恢复aul_ORACLE恢复神器之ODU/AUL/DUL
  16. Response的用法
  17. Matlab求解微分方程组
  18. DeDeCMS采集问题与技巧集锦
  19. 3.2.2对中文的考察2
  20. 纯java手机通讯录

热门文章

  1. feign.codec.DecodeException: Could not extract response: no suitable HttpMessageConverter found
  2. postgres主从配置和切换
  3. Excel 将数据用逗号分割
  4. 罗马数字转换器(用罗马数字构造元素的值取模实现)
  5. 基于剪裁法的反射面设计
  6. 如何批量制作srt字幕呢?
  7. 生成IOS app专用密码教程
  8. 毫米波雷达图解算法原理(基于TI雷达)
  9. 设计同向5倍电压放大电路
  10. Tomcat简介 安装 配置 示例