先验概率与后验概率、贝叶斯区别与联系
本文假设大家都知道什么叫条件概率了(P(A|B)表示在B事件发生的情况下,A事件发生的概率)。
先验概率和后验概率
教科书上的解释总是太绕了。其实举个例子大家就明白这两个东西了。
假设我们出门堵车的可能因素有两个(就是假设而已,别当真):车辆太多和交通事故。
堵车的概率就是先验概率 。
那么如果我们出门之前我们听到新闻说今天路上出了个交通事故,那么我们想算一下堵车的概率,这个就叫做条件概率 。也就是P(堵车|交通事故)。这是有因求果。
如果我们已经出了门,然后遇到了堵车,那么我们想算一下堵车时由交通事故引起的概率有多大,
那这个就叫做后验概率 (也是条件概率,但是通常习惯这么说) 。也就是P(交通事故|堵车)。这是有果求因。
注意:
不是根据"模样"来判断是先验还是后验,而是根据该数据能否"直接得到"且不经过"贝叶斯理论"计算才认为是先验的,也就是说,一个东西是不是先验,光看P(A|B)这种形式是定不下来的,需要看上下文
下面的定义摘自百度百科:
先验概率是指根据以往经验和分析得到的概率,如全概率公式,它往往作为"由因求果"问题中的"因"出现.
后验概率是指依据得到"结果"信息所计算出的最有可能是那种事件发生,如贝叶斯公式中的,是"执果寻因"问题中的"因".
那么这两个概念有什么用呢?
最大似然估计
我们来看一个例子。
有一天,有个病人到医院看病。他告诉医生说自己头痛,然后医生根据自己的经验判断出他是感冒了,然后给他开了些药回去吃。
有人肯定要问了,这个例子看起来跟我们要讲的最大似然估计有啥关系啊。
关系可大了,事实上医生在不知不觉中就用到了最大似然估计(虽然有点牵强,但大家就勉为其难地接受吧^_^)。
怎么说呢?
大家知道,头痛的原因有很多种啊,比如感冒,中风,脑溢血...(脑残>_<这个我可不知道会不会头痛,还有那些看到难题就头痛的病人也不在讨论范围啊!)。
那么医生凭什么说那个病人就是感冒呢?哦,医生说这是我从医多年的经验啊。
咱们从概率的角度来研究一下这个问题。
其实医生的大脑是这么工作的,
他计算了一下
P(感冒|头痛)(头痛由感冒引起的概率,下面类似)
P(中风|头痛)
P(脑溢血|头痛)
...
然后这个计算机大脑发现,P(感冒|头痛)是最大的,因此就认为呢,病人是感冒了。看到了吗?这个就叫最大似然估计(Maximum likelihood estimation,MLE) 。
咱们再思考一下,P(感冒|头痛),P(中风|头痛),P(脑溢血|头痛)是先验概率还是后验概率呢?
没错,就是后验概率。看到了吧,后验概率可以用来看病(只要你算得出来,呵呵)。
事实上,后验概率起了这样一个用途,根据一些发生的事实(通常是坏的结果),分析结果产生的最可能的原因,然后才能有针对性地去解决问题。
那么先验概率有啥用呢?
我们来思考一下,P(脑残|头痛)是怎么算的。
P(脑残|头痛)=头痛的人中脑残的人数/头痛的人数
头痛的样本倒好找,但是头痛的人中脑残的人数就不好调查了吧。如果你去问一个头痛的人你是不是脑残了,我估计那人会把你一巴掌拍飞吧。也就是说,你没法获得P(脑残|头痛)
那我如果去问脑残的人,你现在是否头痛呢?显然,这个是出于关心的一种礼貌询问,想必对方很乐意告诉你。也就是说,很容易可以得到P(头痛|脑残)
接下来先验概率就派上用场了。
根据贝叶斯公式 ,
P(B|A)=P(A|B)P(B)/P(A)
我们可以知道
P(脑残|头痛)=P(头痛|脑残)P(脑残)/P(头痛)
注意,P(头痛|脑残)是先验概率,那么利用贝叶斯公式我们就可以利用先验概率把后验概率P(脑残|头痛)算出来了。
当然也有:
P(头痛|脑残)=脑残的人中头痛的人数/脑残的人数
这样只需要我们去问脑残的人你头痛吗(得到P(头痛|脑残)),明显很安全了。
(你说脑残的人数怎么来的啊,那我们就假设我们手上有一份传说中的脑残名单吧。那位同学不要吵,我没说你在名单上啊。
再说调查脑残人数的话咱就没必要抓着一个头痛的人问了。起码问一个心情好的人是否脑残比问一个头痛的人安全得多)
变量 | 属于概念 |
P(脑残|头痛) | 后验概率,属于条件概率 |
P(头痛|脑残) | 先验概率,属于条件概率 |
P(脑残) | 先验概率 |
P(头痛) | 先验概率 |
我承认上面的例子很牵强,不过主要是为了表达一个意思。
实际场景中:
后验概率P(脑残|头痛)在实际中一般是很难直接经过粗暴的统计直接计算出来,相反先验概率就容易多了。因此一般会利用先验概率来计算后验概率。
似然函数与最大似然估计
下面给出似然函数跟最大似然估计的定义。
我们假设f是一个概率密度函数,那么
$x\mapsto f(x\mid\theta)$(CSDN的公式编辑器喜欢乱升级,所以把markdown公式留在这里)
是一个条件概率密度函数(θ 是固定的)
而反过来,
$\theta\mapsto f(x\mid\theta)$(CSDN的公式编辑器喜欢乱升级,所以把markdown公式留在这里)
叫做似然函数 (x是固定的)。
一般把似然函数写成
θ是因变量。
而最大似然估计 就是求在θ的定义域中,当似然函数取得最大值时θ的大小。
意思就是呢,当后验概率最大时θ的大小。也就是说要求最有可能的原因。
由于对数函数不会改变大小关系,有时候会将似然函数求一下对数,方便计算。
例子:
我们假设有三种硬币,他们扔到正面的概率分别是1/3,1/2,2/3。我们手上有一个硬币,但是我们并不知道这是哪一种。因此我们做了一下实验,我们扔了80次,有49次正面,31次背面。那么这个硬币最可能是哪种呢?我们动手来算一下。这里θ的定义域是{1/3,1/2,2/3}
当p=2/3时,似然函数的值最大,因此呢,这个硬币很可能是2/3。
参考资料
http://en.wikipedia.org/wiki/Likelihood_function
http://en.wikipedia.org/wiki/Maximum_Likelihood
先验概率与后验概率、贝叶斯区别与联系相关推荐
- [转] 先验概率与后验概率贝叶斯与似然函数
from: https://blog.csdn.net/shenxiaoming77/article/details/77505549 先验概率和后验概率 教科书上的解释总是太绕了.其实举个例子大家就 ...
- 先验概率 后验概率 贝叶斯法则 贝叶斯公式
1.先验.后验 在拉丁文中指"来自先前的东西",或稍稍引申指"在经验之前". 近代西方传统中,认为先验指无需经验或先于经验获得的知识.它通常与后验知识相比较,后 ...
- R语言︱贝叶斯网络语言实现及与朴素贝叶斯区别(笔记)
每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 一.贝叶斯网络与朴素贝叶斯的区别 朴素贝叶斯的 ...
- 朴素贝叶斯基本原理和预测过程、先验概率、后验概率、似然概率概念
贝叶斯原理是英国数学家托马斯·贝叶斯提出的. 贝叶斯原理 建立在主观判断的基础上:在我们不了解所有客观事实的情况下,同样可以先估计一个值,然后根据实际结果不断进行修正. 举例: 一个袋子里有10个球, ...
- 机器学习34:贝叶斯先验概率
机器学习34:贝叶斯先验概率: 理解贝叶斯先验概率是为了更好的理解正则化的概念. (1)贝叶斯先验概率和贝叶斯后验概率: 1.先验概率是指根据以往经验和分析得到的概率,即在事情发生之前事情发生的概率. ...
- 用最骚的话让你彻底弄懂贝叶斯!
来自网络 摘要:贝叶斯方法对于由证据的积累来推测一个事物发生的概率具有重大作用,它告诉我们当我们要预测一个事物,我们需要的是首先根据已有的经验和知识推断一个先验概率,然后在新证据不断积累的情况下调整这 ...
- 机器学习监督学习之分类算法---朴素贝叶斯理论知识
感谢Jack-Cui大佬的知识分享 机器学习专栏点击这里 目录 感谢Jack-Cui大佬的知识分享 0. 概述 1. 朴素贝叶斯理论 1.1 贝叶斯理论 1.1.1 相关计算公式:条件概率公式,贝叶斯 ...
- [zt]数学之美番外篇:平凡而又神奇的贝叶斯方法
数学之美番外篇:平凡而又神奇的贝叶斯方法 Tags: 数学, 机器学习与人工智能, 计算机科学 save it69 saved tags: 贝叶斯 math bayesian algorithm 数学 ...
- 人工智能重点汇总(搜索策略、博弈、贝叶斯、SVM、神经网络、弧相容、SVM、决策树、反向传播、卷积神经网络)
前言:智能Agent 理性Agent:信息手机 + 自主学习: 任务环境(PEAS)四要素: 性能: 环境: 执行器: 传感器: ❗ 环境的性质 环境的性质决定了agent的设计 最难处理的情况: ...
最新文章
- 《深入理解计算机系统》第七章——链接知识点总结
- CSS浮动元素特点有什么
- 关于主机的思维导图_几张思维导图,让你清楚的知道ip地址怎么回事?
- css sgc加密,ASP+SGC实现柱状图
- Flask 开发填坑
- 论文笔记_S2D.44_自监督的从稀疏到稠密:用激光雷达和单目摄像机进行自监督深度补全
- 软考高项:十大知识领域47个过程组速记
- 柳传志的回复:联想集团大裁员:公司不是家
- python正态分布函数_使用Python实现正态分布、正态分布采样
- ios 设置属性的center_iOS游戏平台Game Center成就显示设置指南
- 用Notepad++实现文本比较
- vant的安装和引入
- 职业教育迎来新的发展期
- COMPUTER METHODS AND PROGRAMS IN BIOMEDICINE期刊投稿
- VLookup怎么用详细步骤?VLookup函数的使用方法及实例
- 利用计算机证明猜想,计算机科学家利用量子纠缠系统,证实44年前的一个猜想是错误的...
- 看完面经,他拿出一打大厂offer玩起了斗地主,人生不过是如此枯燥乏味....
- 两个数组合并成一个数组
- XEN-libvirt札记
- 阿里面试官的 说一下从url输入到返回请求的过程 问的难度就是不一样!