贝叶斯推理:概率分布
贝叶斯推理:概率分布
设定 ZZZ 是随机变量,与 Z" role="presentation" style="position: relative;">ZZZ 相关联的是概率分布函数。ZZZ 可以输出不同值,该函数则对各值赋于相应的概率。
随机变量 Z" role="presentation" style="position: relative;">ZZZ 有三种类型:
- 离散型。例如货币、电影评级、选票数目等。
- 连续型。例如温度、速度、时间等。
- 混合型。 是上述两种变量的联合。
离散型变量的概率分布
离散变量 ZZZ 的分布叫做概率质量函数,以 P(Z=k)" role="presentation" style="position: relative;">P(Z=k)P(Z=k)P(Z = k) 表示。可见,ZZZ 由多个值 k" role="presentation" style="position: relative;">kkk 构成,并由该函数全面描述。知道了该函数就知道了 ZZZ 的行为。常用的概率质量函数有多个,其中一个非常有用的是泊松分布( Poisson-distributed ):
P( Z = k ) = \frac{\lambda^k e^{-\lambda} } { k!} ,k = 0,1,2,... λλ\lambda 叫做概率分布的参数,并控制着分布的形状。对于泊松分布,λλ\lambda 可为任意正数。增大 λλ\lambda 值,我们可以加大较大数值对应的概率;减小 λλ\lambda 值, 我们可以加大较小数值对应的概率。λλ\lambda 可视作泊松分布的密度。
与 λλ\lambda 不同,kkk 必须是正整数。这一点十分重要。因为,如果你建立人口模型,不会允许数据出现 4.25 或者 5.612 个人。
如果随机变量 Z" role="presentation" style="position: relative;">ZZZ 有泊松质量分布,则记作:
Z ∼ Poi(λ) 泊松分布的一个有用的特点,是它的预期值等于它的参数值:
E[Z|λ] = λ 这个特点经常用到,应该记住它。
在图-1中,画出了不同 λλ\lambda 值的概率质量分布。首先, λλ\lambda 值的增大,会使较大数值对应的概率增大;其次,虽然 x 轴终止于15,但概率分布并未终止。每个正整数都有相应的正值的概率。
%matplotlib inline
from IPython.core.pylabtools import figsize
import numpy as np
from matplotlib import pyplot as plt
import scipy.stats as statsfigsize(12.5, 4)a = np.arange(16)poi = stats.poisson # 泊松离散随机变量
lambda_ = [1.5, 4.25] #λ参数colors = ["#348ABD", "#A60628"]
plt.bar(a, poi.pmf(a, lambda_[0]), color=colors[0],label="$\lambda = %.1f$" % lambda_[0], alpha=0.60,edgecolor=colors[0], lw="3")# poi.pmf: 数组 a 中各值的概率质量函数
plt.bar(a, poi.pmf(a, lambda_[1]), color=colors[1],label="$\lambda = %.1f$" % lambda_[1], alpha=0.60,edgecolor=colors[1], lw="3")
plt.xticks(a + 0.4, a) # 设置 x 轴刻度
plt.legend()
plt.ylabel("Probability of $k$")
plt.xlabel("$k$")
plt.title("Probability mass function of a Poisson random variable,\differing $\lambda$ values");
图-1
连续型变量的概率分布
与概率质量函数不同,连续随机变量有个概率密度函数。这两个函数极其不同。概率密度函数是指数型的,这般模样:
fZ(z|λ) = λe^{−λz}, z ≥ 0
与泊松随机变量相同,指数型的随机变量也是只取正值。不同的是,它可以取分数,如 4.25 或 5.612401。这个特点使它不适合选择整数数据,而非常适合选择时间、温度(当然是绝对温度)或其他精确、正值的变量。图-2,表示2个不同 λλ\lambda 值的概率密度函数。
指数型的随机变量 ZZZ 带有参数 λ" role="presentation" style="position: relative;">λλλ,呈现指数型分布,记为:
Z ∼ Exp(λ) 指数型随机变量的预期值,等于 λλ\lambda 的倒数:
E[Z|λ] =\frac{1}\lambda
%matplotlib inline
from IPython.core.pylabtools import figsize
import numpy as np
from matplotlib import pyplot as plt
import scipy.stats as statsa = np.linspace(0, 4, 100)
expo = stats.expon
lambda_ = [0.5, 1]
for l, c in zip(lambda_, colors):plt.plot(a, expo.pdf(a, scale=1./l), lw=3,color=c, label="$\lambda = %.1f$" % l)plt.fill_between(a, expo.pdf(a, scale=1./l), color=c, alpha=.33)
plt.legend()
plt.ylabel("Probability density function at $z$")
plt.xlabel("$z$")
plt.ylim(0,1.2)
plt.title("Probability density function of an exponential random\variable, differing $\lambda$ values");
图-2
重要的是要知道,概率密度函数在某点的值,与该点的概率值并不相等。
λλ\lambda 到底是什么?
在现实世界中,我们只能看到 ZZZ ,但看不到 λ" role="presentation" style="position: relative;">λλ\lambda。只能试图根据 ZZZ 确定 λ" role="presentation" style="position: relative;">λλ\lambda,但这很困难,因为二者没有逐一对应的值。人们创造了许多不同方法,以求解决评估 λλ\lambda 的问题。可是,由于从未有人真正观察到 λλ\lambda ,没人敢肯定哪个方法是最好的。
贝叶斯学派认为不要企图准确猜测 λλ\lambda ,而是仅限于为 λλ\lambda 设定分布概率,从而讨论它可能是什么。
看上去这很怪异。毕竟 λλ\lambda 的值是固定的,而不是、也不必是随机的。我们只能说,相信 λλ\lambda 的存在。
贝叶斯推理:概率分布相关推荐
- 统计学原理-----概率分布
0.大纲: 1.什么是概率分布? 概率分布就是随机变量与对应概率关系的函数.换句话说,概率分布就是随机变量和概率的映射,所有的事件都会对应一个概率.某个随机变量的所有概率形成的概率-事件分布就是该随机 ...
- Python概率分布大全(含可视化)
文章目录 术语 前言 整数 浮点数 抽取 字节 洗牌 排列 贝塔分布 二项分布 卡方分布 狄利克雷分布 指数分布 F分布 伽玛分布 几何分布 耿贝尔分布 超几何分布 拉普拉斯分布(双指数分布) 逻辑斯 ...
- 机器学习中贝叶斯判决、概率分布、样本等概念间的关系
以下是在看模型识别,机器学习及数理统计时,对贝叶斯决策.概率分布.样本关系的总结,每想到一点就写下来,比较乱,这块需要反复学习.慢慢理解. 1. 机器学习的一些概念: 什么是机器学习? 机器学习包含哪 ...
- 【实例讲解】贝叶斯推理原理
今天看论文的时候,看到了贝叶斯推理,搜索的时候,正巧搜到了一个大牛的博客,博客中对于贝叶斯推理的进阶实例讲解,真的是非常精彩,这里将自己对贝叶斯推理的收获记录下来.如有理解错误的地方,欢迎指正共同讨论 ...
- 实例详解贝叶斯推理的原理
推理是一种精确的数据预测方式.在数据没有期望的那么多,但却想毫无遗漏地,全面地获取预测信息时非常有用. 提及贝叶斯推理时,人们时常会带着一种敬仰的心情.其实并非想象中那么富有魔力,或是神秘.尽管贝叶斯 ...
- 线性回归与贝叶斯推理——漫谈机器学习
1. 从观察出发--回归问题 在统计学中,我们认为一个变量是服从某种理想分布的,称为理想变量.而为了获得理想变量的值,我们需要去观察这个世界,并得到观察数据,称为观察变量.观察变量与理想变量之间的函数 ...
- 一文读懂贝叶斯推理问题:MCMC方法和变分推断
全文共6415字,预计学习时长20分钟或更长 图片来源:pexels.com/@lum3n-com-44775 贝叶斯推理(Bayesian inference)是统计学中的一个重要问题,也是许多机器 ...
- 贝叶斯推理三种方法:MCMC 、HMC和SBI
对许多人来说,贝叶斯统计仍然有些陌生.因为贝叶斯统计中会有一些主观的先验,在没有测试数据的支持下了解他的理论还是有一些困难的.本文整理的是作者最近在普林斯顿的一个研讨会上做的演讲幻灯片,这样可以阐明为 ...
- 均匀分布取某一点概率_概率和概率分布
概率与概率分布是统计学中的基础概念,在我们的高中的课本中就接触过了,如果有遗忘,一起来回顾一下吧! 知识点: 概率 概率分布 一.概率 说到概率,需要先了解一个概念,叫做随机试验.随机试验是指在相同条 ...
最新文章
- Java SE7新特性之switch语句中使用字符串
- python编程语言能干什么-python编程语言的优势与劣势--python能干啥
- idea redis 插件_Redis客户端RDM收费后,还有哪些开源的替代品呢?
- 技术与管理并重才能走的更远
- AutoMapper2
- ChaiNext:过去24小时,市场情绪“燥”
- Flutter 升级 2.0 填坑指导,带你原地起飞
- 软考历年真题以及真题试卷
- thinkpad X230 黑屏折腾
- Teamviewer远程工具使用
- 网站部署证书 百度浏览器仍提示不安全网站怎么办
- Python人脸识别 Python3.7+OpenCV+Dlib+罗技C920摄像头 实现离线实时摄像头画面人脸检测+识别
- 数学符号“s.t.”的意义
- 免费HTTP代理商如何
- oracle数据库恢复aul_ORACLE恢复神器之ODU/AUL/DUL
- Response的用法
- Matlab求解微分方程组
- DeDeCMS采集问题与技巧集锦
- 3.2.2对中文的考察2
- 纯java手机通讯录