最大似然估计 (MLE) 最大后验概率(MAP)

1) 最大似然估计 MLE

给定一堆数据,假如我们知道它是从某一种分布中随机取出来的,可是我们并不知道这个分布具体的参,即“模型已定,参数未知”。例如,我们知道这个分布是正态分布,但是不知道均值和方差;或者是二项分布,但是不知道均值。 最大似然估计(MLE,Maximum Likelihood Estimation)就可以用来估计模型的参数。MLE的目标是找出一组参数,使得模型产生出观测数据的概率最大:

其中就是似然函数,表示在参数下出现观测数据的概率。我们假设每个观测数据是独立的,那么有

为了求导方便,一般对目标取log。 所以最优化对似然函数等同于最优化对数似然函数:

举一个抛硬币的简单例子。 现在有一个正反面不是很匀称的硬币,如果正面朝上记为H,方面朝上记为T,抛10次的结果如下:

求这个硬币正面朝上的概率有多大?

很显然这个概率是0.2。现在我们用MLE的思想去求解它。我们知道每次抛硬币都是一次二项分布,设正面朝上的概率是,那么似然函数为:

x=1表示正面朝上,x=0表示方面朝上。那么有:

求导:

令导数为0,很容易得到:

也就是0.2 。

2) 最大后验概率  MAP

以上MLE求的是找出一组能够使似然函数最大的参数,即。 现在问题稍微复杂一点点,假如这个参数有一个先验概率呢?比如说,在上面抛硬币的例子,假如我们的经验告诉我们,硬币一般都是匀称的,也就是=0.5的可能性最大,=0.2的可能性比较小,那么参数该怎么估计呢?这就是MAP要考虑的问题。 MAP优化的是一个后验概率,即给定了观测值后使概率最大:

把上式根据贝叶斯公式展开:

我们可以看出第一项就是似然函数,第二项就是参数的先验知识。取log之后就是:

回到刚才的抛硬币例子,假设参数有一个先验估计,它服从Beta分布,即:

而每次抛硬币任然服从二项分布:

那么,目标函数的导数为:

求导的第一项已经在上面MLE中给出了,第二项为:

令导数为0,求解为:

其中,表示正面朝上的次数。这里看以看出,MLE与MAP的不同之处在于,MAP的结果多了一些先验分布的参数。

补充知识: Beta分布

Beat分布是一种常见的先验分布,它形状由两个参数控制,定义域为[0,1]

Beta分布的最大值是x等于的时候:

所以在抛硬币中,如果先验知识是说硬币是匀称的,那么就让。 但是很显然即使它们相等,它两的值也对最终结果很有影响。它两的值越大,表示偏离匀称的可能性越小:

转载于:https://www.cnblogs.com/jxr041100/p/8434063.html

机器学习: 最大似然估计 (MLE) 最大后验概率(MAP)相关推荐

  1. 机器学习:最大似然估计与最大后验概率估计

    在机器学习领域,概率估计是经常用到的一种模型,而概率估计中,我们经常会看到两种估计模型,一种是最大似然估计,即 Maximum likelihood, 另外一种就是最大后验概率估计,即 Maximum ...

  2. 机器学习数学基础(偏差方差、最大似然估计、贝叶斯统计、MAP)

    目录 偏差方差 一致性 最大似然估计 贝叶斯统计 最大后验概率 如果这篇文章对你有一点小小的帮助,请给个关注喔~我会非常开心的~ 偏差方差 偏差的定义如下: 如果  ,那么估计量被称为无偏估计. 如果 ...

  3. 最大似然估计、最大后验概率估计和贝叶斯估计

      本内容主要介绍概率论与统计学相关基础知识,主要涉及 联合概率.边缘概率和条件概率:贝叶斯公式.先验概率.后验概率和似然函数:最大似然估计.最大后验概率估计和贝叶斯估计 等.为机器学习中的贝叶斯分类 ...

  4. 详解最大似然估计、最大后验概率估计及贝叶斯公式

    最大似然估计(Maximum likelihood estimation, 简称MLE)和最大后验概率估计(Maximum a posteriori estimation, 简称MAP)是很常用的两种 ...

  5. 贝叶斯公式的对数似然函数_贝叶斯估计、最大似然估计、最大后验概率估计

    贝叶斯估计.最大似然估计(MLE).最大后验概率估计(MAP)这几个概念在机器学习和深度学习中经常碰到,读文章的时候还感觉挺明白,但独立思考时经常会傻傻分不清楚(

  6. 最大似然估计和最大后验概率估计的理解与求解

    1. 最大似然估计的理解 最大似然估计(Maximum likelihood estimation, 简称MLE)和最大后验概率估计(Maximum a posteriori estimation, ...

  7. 最大似然估计(MLE),最大后验概率估计(MAP),贝叶斯估计入门讲解

    已知数据X,去拟合某个概率模型的参数θ,是最基本的机器学习过程. 本文将入门讲解3个最基本的方法:最大似然估计(Maximum Likelihood Estimation,简称MLE),最大后验概率估 ...

  8. 贝叶斯估计、最大似然估计、最大后验概率估计的区别

    似然函数和概率函数(很重要) 这个式子有两种解读方法: 把 theta 看成常量,而 x 为变量,此时式子为概率函数,表示在不同 x 出现的概率. 把 x 看成常量,theta 看成变量,此时式子为似 ...

  9. 最大似然估计与最大后验概率的区别与联系

    最大似然估计(MLE): 最大似然估计提供了一种给定观察数据来评估模型参数的方法,即:"模型已定,参数未知".简单而言,假设我们要统计全国人口的身高,首先假设这个身高服从服从正态分 ...

  10. 最大似然估计和最大后验概率估计的区别

    最大似然估计(MLE) 1.似然函数:L(θ|x)=P(X=x|θ) ①物理意义:某次实验,θ取不同值时,出现X=x的结果的概率: ②似然函数是参数(θ)的函数: ③似然函数是条件转移概率. 例1:设 ...

最新文章

  1. 鲲鹏高校行太原站来袭,两大课程一站式掌握未来潮流
  2. faiss(1):简介 安装 与 原理
  3. 简单几步即可判断Linux系统有无被DDOS攻击的方法
  4. OpenCV——人脸检测
  5. Teams新功能更新【六月底】Microsoft Teams: Music on Hold
  6. C++Primer学习之二#define,const,constexpr
  7. 常用排序算法的python实现
  8. 分享Silverlight/WPF/Windows Phone一周学习导读(10月22日-10月29日)
  9. Jetson Xavier中安装DIGITS-》Caffee中的错误
  10. Android——简单模拟银行转账
  11. QT写的U盘批量复制小工具
  12. 深入理解CatBoost
  13. /etc/mtab 文件
  14. Sass和Scss的区别
  15. 【数字图像处理】图像几何变换之 图像的极坐标变化展开鱼眼图
  16. liunx在线安装mysql/修改mysql密码/设置简单mysql密码
  17. 如何解除任务管理器被禁用
  18. Android微信页面缓存清理,安卓微信浏览器缓存如何清理
  19. MySQL:排序(filesort)详细解析(8000字长文)
  20. maven--profile--使用/教程/示例

热门文章

  1. Linux 设置时区 命令
  2. Zookeeper全解析——Client端(转)
  3. InnoDB脏页,重做日志文件
  4. 虚方法和重写方法的继承特性
  5. c语言小树苗健康指数,一颗特别的小树苗.doc
  6. 加一条平行于y轴的直线_Hepco海普克应用案例—直线V型滚轮导轨广泛应用于多轴机械手...
  7. 织梦本地调试运行PHP不显示图片,织梦CMS手机端不显示图片的原因及解决方法!...
  8. (五)洞悉linux下的Netfilteriptables:如何理解连接跟踪机制?(1)
  9. 平衡二叉树(AVL Tree)
  10. Android StrictMode类使用实例