前言,MLE与MAP的联系

在前一篇文章参数估计之极大似然估计中提到过频率学派和贝叶斯学派的区别。如下图

在极大似然估计(MLE)中,我们求参数,通过使得似然函数最大,此时为一个待估参数,其本身是确定的,即使目前未知。

MLE求的是怎样的参数可以让事件集发生的概率最大。通过不断改变固定的参数去寻找一个极大值。

在最大后验估计(MAP)中,引用贝叶斯学派的思想,将参数看成一个随机变量。

MAP考量的是事件集已经发生了,那在事件集发生的情况下,哪个发生的概率最大。其实与MLE正好相反。

拿抛不均匀硬币举例,抛了10次,9次正1次反,问你硬币抛出正面的概率是多少?

MLE假设抛出正面的概率为,那抛出这个事件的概率为,求该事件发生概率的极大值所对应的,此时仅为一个函数的参数,而非随机变量。

MAP通过求解最大的所对应的为“抛了10次,9次正1次反”这个事件,求在已经发生的情况下,使得最大的,此时为一个随机变量。

以上即为两者的核心思想。MAP具体介绍马上开始,MLE的具体介绍详见参数估计之极大似然估计。


最大后验概率估计(Maximum A Posteriori)

在最大似然估计(MLE)中,将看做是未知的参数,说的通俗一点,最大似然估计是的函数,其求解过程就是找到使得最大似然函数最大的那个参数

从最大后验估计开始,将参数   看成一个随机变量,并在已知样本集  的条件下,估计参数 

这里一定要注意,在最大似然估计中,参数是一个定值,只是这个值未知,最大似然函数是的函数,这里是没有概率意义的。但是,在最大后验估计中,是有概率意义的,有自己的分布,而这个分布函数,需要通过已有的样本集合得到,即最大后验估计需要计算的是 

根据贝叶斯理论:

这就是参数关于已有数据集合的后验概率,要使得这个后验概率最大,和极大似然估计一样,这里需要对后验概率函数求导。由于分子中的相对于是独立的,所以可以直接忽略掉

为了得到参数,和MLE一样,需要对求梯度,并使其等于0:

注意:这里和极大似然估计中的似然函数是一样的,只是记法不一样。MAP和MLE的区别是:MAP是在ML的基础上加上了

这里需要说明,虽然从公式上来看 ,但是这两种算法有本质的区别,MLE将视为一个确定未知的值,而MAP则将视为一个随机变量。

在MAP中,称为的先验,假设其服从均匀分布,即对于所有取值,都是同一个常量,则MAP和MLE会得到相同的结果。当然了,如果的方差非常的小,也就是说,是近似均匀分布的话,MAP和ML的结果自然也会非常的相似。

一个简单的例子

假设有五个袋子,各袋中都有无限量的饼干(樱桃口味或柠檬口味),已知五个袋子中两种口味的比例分别是

    袋子1:樱桃 100%

    袋子2:樱桃 75% + 柠檬 25%

    袋子3:樱桃 50% + 柠檬 50%

    袋子4:樱桃 25% + 柠檬 75%

    袋子5:柠檬 100%

如果只有如上所述条件,那问从同一个袋子中连续拿到2个柠檬饼干,那么这个袋子最有可能是上述五个的哪一个?

我们首先采用最大似然估计来解这个问题,写出似然函数。假设从袋子中能拿出柠檬饼干的概率为(我们通过这个概率来确定是从哪个袋子中拿出来的),则似然函数可以写作

由于的取值是一个离散值,即上面描述中的0,25%,50%,75%,1。我们只需要评估一下这五个值哪个值使得似然函数最大即可,得到为袋子5。这里便是最大似然估计的结果。

上述最大似然估计有一个问题,就是没有考虑到模型本身的概率分布,下面我们扩展这个饼干的问题。

假设拿到袋子1或5的机率都是0.1,拿到2或4的机率都是0.2,拿到3的机率是0.4,那同样上述问题的答案呢?这个时候就变MAP了。我们根据公式

写出我们的MAP函数:

根据题意的描述可知,的取值分别为0,25%,50%,75%,1。的取值分别为0.1,0.2,0.4,0.2,0.1。分别计算出MAP函数的结果为:0,0.0125,0.125,0.28125,0.1。由上可知,通过MAP估计可得结果是从第四个袋子中取得的最高。

在MAP中我们应注意的是:

MAP与MLE最大区别是MAP中加入了模型参数本身的概率分布,或者说。MLE中认为模型参数本身的概率的是均匀的,即该概率为一个固定值。

同时一个合理的先验概率假设是很重要的,否则会极大的影响后验概率的结果!

参考文章:

贝叶斯线性回归(Bayesian Linear Regression)

最大似然估计(MLE)和最大后验概率(MAP)

【数学基础】参数估计之最大后验估计(Maximum A Posteriori,MAP)相关推荐

  1. 最大似然估计(Maximum Likehood Estimation,MLE)和最大后验估计(Maximum A Posteriori estimation, MAP)

    概率与统计的区别 概率研究的问题是一个模型和它的参数已知的情况下,怎么去预测这个模型产生的结果的特性(如均值,方差,协方差等) 统计研究的问题是在已有的大量的数据的情况下,推断产生这堆数据的模型及其参 ...

  2. 很好的例子理解区别 Maximum Likelihood (ML) Maximum a posteriori (MAP)

    节食一定会瘦, 而食减肥药有一半机会瘦. P(瘦|节食)=1 P(瘦|食减肥药)=0.5 A女士很瘦. By Maximum Likelihood(ML),则A女士最大机会节食. 但如果 given ...

  3. A example of Maximum A Posteriori (MAP) estimation

  4. Maximum Likelihood (MLE) Maximum a posteriori (MAP)的分別

    有趣且浅显易懂的举例 刚刚在找MAP的资料,无意中找到有人写的一个有趣的文章,拿减肥当例子真的是浅显易懂 XD 如果拿 Artificial Intelligence: A Modern Approa ...

  5. 机器学习基础:最大似然(Maximum Likelihood) 和最大后验估计 (Maximum A Posteriori Estimation)的区别

    前言 在研究SoftMax交叉熵损失函数(Cross Entropy Loss Function)的时候,一种方法是从概率的角度来解释softmax cross entropy loss functi ...

  6. 最大后验概率(MAP)- maximum a posteriori(转载)

    原文:http://student.csdn.net/space.php?uid=119638&do=blog&id=11801 在统计学中,最大后验(英文为Maximum a pos ...

  7. 最大后验概率(MAP)- maximum a posteriori

    原文:http://student.csdn.net/space.php?uid=119638&do=blog&id=11801 在统计学中,最大后验(英文为Maximum a pos ...

  8. 极大后验概率(MAP)- maximum a posteriori(转载)

    在统计学中,最大后验(英文为Maximum a posteriori,缩写为MAP)估计方法根据经验数据获得对难以观察的量的点估计.它与最大似然估计中的 Fisher 方法有密切关系,但是它使用了一个 ...

  9. 【转】最大后验概率(MAP)- maximum a posteriori

    最大后验概率(MAP)- maximum a posteriori var $tag='map,最大后验概率,杂谈'; var $tag_code='55bc272ff71193850b39cc269 ...

最新文章

  1. 初中数学四十二个几何模型_【初中数学】一题贯穿初中几何
  2. Oracle入门(十四.4)之在PL / SQL中使用变量
  3. 推荐您使用 Markdown 来编辑文章
  4. 基础Git操作与GitHub协作吐血整理,收好!| 原力计划
  5. linux oracle 12170,ora-12170 linux
  6. python怎样画立体图-如何用Matplotlib 画三维图的示例代码
  7. 《王二丫的甜品店》技术支持网址
  8. 程序猿段子_那些关于程序员的段子
  9. Scrapy图片分类异步下载
  10. VS2015中“项目无法加载,因为它缺少安装组件”的解决方法
  11. 爱创课堂每日一题第五十六天-对前端界面工程师这个职位是怎么样理解的?它的前景会怎么样?...
  12. 苹果电脑python快捷键_我常用用的MAC快捷键和手势
  13. 武汉大学和厦门大学计算机,武汉大学和厦门大学谁更强,为什么有人说这两所大学名气大于实力...
  14. 2016中国移动办公论坛暨《2016中国移动办公男神报告》发布会成功举办
  15. 三门课成绩总分用c语言,编写一个C语言程序:输入三个学生三门课的成绩,计算每个学生的总分和平均成绩...
  16. IDEA配置SVN同步路径
  17. STM8系列5大主流成员(S,L,T,AF,AL)
  18. termux获取sd卡读写权限_stm32 SPI读写储存卡(MicroSD TF卡)
  19. sql、DB、DBMS分别是什么,他们之间什么关系?
  20. 推荐一些2021年整理27套微信小程序的毕业设计、毕设参考作品案例

热门文章

  1. 炫龙P6笔记本搭建Windows 10+Ubuntu双系统
  2. 为什么Mysql底层采用B+树做索引?
  3. 进入DFU模式恢复教程 iOS9强制降级iOS8教程
  4. 金属学复习【2】--- 纯金属的结晶
  5. mysql数据库中怎么删除一行_数据库教程_mysql如何删除表中一行数据?- 中国it教程网...
  6. 黑客谈对一台BT主机的入侵过程
  7. Android通话录音流程
  8. 面试难,应聘难,好工作,今安在?
  9. 鲍姆-韦尔奇算法求解HMM参数
  10. 团队管理5--技术管理如何兼顾技术