文章转载自:Leavingseason http://www.cnblogs.com/sylvanas2012/p/5058065.html

1) 最大似然估计 MLE

给定一堆数据,假如我们知道它是从某一种分布中随机取出来的,可是我们并不知道这个分布具体的参数,即“模型已定,参数未知”。例如,我们知道这个分布是正态分布,但是不知道均值和方差;或者是二项分布,但是不知道均值。 最大似然估计(MLE,Maximum Likelihood Estimation)就可以用来估计模型的参数。MLE的目标是找出一组参数,使得模型产生出观测数据的概率最大:

其中就是似然函数,表示在参数下出现观测数据的概率。我们假设每个观测数据是独立的,那么有

为了求导方便,一般对目标取log。 所以最优化对似然函数等同于最优化对数似然函数:

举一个抛硬币的简单例子。 现在有一个正反面不是很匀称的硬币,如果正面朝上记为H,方面朝上记为T,抛10次的结果如下:

求这个硬币正面朝上的概率有多大?

很显然这个概率是0.2。现在我们用MLE的思想去求解它。我们知道每次抛硬币都是一次二项分布,设正面朝上的概率是,那么似然函数为:

x=1表示正面朝上,x=0表示方面朝上。那么有:

求导:

令导数为0,很容易得到:

也就是0.2 。

2) 最大后验概率  MAP

以上MLE求的是找出一组能够使似然函数最大的参数,即。 现在问题稍微复杂一点点,假如这个参数有一个先验概率呢?比如说,在上面抛硬币的例子,假如我们的经验告诉我们,硬币一般都是匀称的,也就是=0.5的可能性最大,=0.2的可能性比较小,那么参数该怎么估计呢?这就是MAP要考虑的问题。 MAP优化的是一个后验概率,即给定了观测值后使概率最大:

把上式根据贝叶斯公式展开:

我们可以看出第一项就是似然函数,第二项就是参数的先验知识。取log之后就是:

回到刚才的抛硬币例子,假设参数有一个先验估计,它服从Beta分布,即:

而每次抛硬币任然服从二项分布:

那么,目标函数的导数为:

求导的第一项已经在上面MLE中给出了,第二项为:

令导数为0,求解为:

其中,表示正面朝上的次数。这里看以看出,MLE与MAP的不同之处在于,MAP的结果多了一些先验分布的参数。

补充知识: Beta分布

Beat分布是一种常见的先验分布,它形状由两个参数控制,定义域为[0,1]

Beta分布的最大值是x等于的时候:

所以在抛硬币中,如果先验知识是说硬币是匀称的,那么就让。 但是很显然即使它们相等,它两的值也对最终结果很有影响。它两的值越大,表示偏离匀称的可能性越小:

转载于:https://www.cnblogs.com/chaofn/p/8960976.html

最大似然估计 (MLE) 最大后验概率(MAP)相关推荐

  1. 最大似然估计和最大后验概率估计的理解与求解

    1. 最大似然估计的理解 最大似然估计(Maximum likelihood estimation, 简称MLE)和最大后验概率估计(Maximum a posteriori estimation, ...

  2. 最大似然估计、最大后验概率估计和贝叶斯估计

      本内容主要介绍概率论与统计学相关基础知识,主要涉及 联合概率.边缘概率和条件概率:贝叶斯公式.先验概率.后验概率和似然函数:最大似然估计.最大后验概率估计和贝叶斯估计 等.为机器学习中的贝叶斯分类 ...

  3. 详解最大似然估计、最大后验概率估计及贝叶斯公式

    最大似然估计(Maximum likelihood estimation, 简称MLE)和最大后验概率估计(Maximum a posteriori estimation, 简称MAP)是很常用的两种 ...

  4. 贝叶斯公式的对数似然函数_贝叶斯估计、最大似然估计、最大后验概率估计

    贝叶斯估计.最大似然估计(MLE).最大后验概率估计(MAP)这几个概念在机器学习和深度学习中经常碰到,读文章的时候还感觉挺明白,但独立思考时经常会傻傻分不清楚(

  5. 机器学习数学基础(偏差方差、最大似然估计、贝叶斯统计、MAP)

    目录 偏差方差 一致性 最大似然估计 贝叶斯统计 最大后验概率 如果这篇文章对你有一点小小的帮助,请给个关注喔~我会非常开心的~ 偏差方差 偏差的定义如下: 如果  ,那么估计量被称为无偏估计. 如果 ...

  6. 机器学习:最大似然估计与最大后验概率估计

    在机器学习领域,概率估计是经常用到的一种模型,而概率估计中,我们经常会看到两种估计模型,一种是最大似然估计,即 Maximum likelihood, 另外一种就是最大后验概率估计,即 Maximum ...

  7. 最大似然估计(MLE),最大后验概率估计(MAP),贝叶斯估计入门讲解

    已知数据X,去拟合某个概率模型的参数θ,是最基本的机器学习过程. 本文将入门讲解3个最基本的方法:最大似然估计(Maximum Likelihood Estimation,简称MLE),最大后验概率估 ...

  8. 贝叶斯估计、最大似然估计、最大后验概率估计的区别

    似然函数和概率函数(很重要) 这个式子有两种解读方法: 把 theta 看成常量,而 x 为变量,此时式子为概率函数,表示在不同 x 出现的概率. 把 x 看成常量,theta 看成变量,此时式子为似 ...

  9. 最大似然估计与最大后验概率的区别与联系

    最大似然估计(MLE): 最大似然估计提供了一种给定观察数据来评估模型参数的方法,即:"模型已定,参数未知".简单而言,假设我们要统计全国人口的身高,首先假设这个身高服从服从正态分 ...

  10. 最大似然估计和最大后验概率估计的区别

    最大似然估计(MLE) 1.似然函数:L(θ|x)=P(X=x|θ) ①物理意义:某次实验,θ取不同值时,出现X=x的结果的概率: ②似然函数是参数(θ)的函数: ③似然函数是条件转移概率. 例1:设 ...

最新文章

  1. UTF-8 CPP的使用
  2. hexo d 部署博客时出错
  3. web 应用常见安全漏洞一览
  4. Facebook视频支持AV1
  5. Spring Boot集成Druid监控
  6. (简单) POJ 3984 迷宫问题,BFS。
  7. MATLAB中zero和ones函数(转载)
  8. 面试了57位程序员,我发现混得好的人都有这个特质!
  9. python 地理处理包:geopandas介绍
  10. 安装 Linux 系统,如何选择操作系统和电脑硬件
  11. 计算机如何恢复记事本,如何使用电脑桌面便签恢复误删除了的记事本数据内容?...
  12. 市场调研—2021-2027全球与中国肌酸激酶试剂市场现状及未来发展趋势
  13. P3P求解相机姿态原理介绍
  14. libnet发包java语言_Net-speeder多倍发包脚本
  15. 计算机网络安全课程心得,学习信息安全专业的心得体会
  16. GaN制备micro-led(一)
  17. 从零接入微信公众号(Java实现 附源码)
  18. 【电子产品】ThinkPad S5 Intel(R) Dual Band Wireless-AC 3165 网卡驱动莫名其妙挂掉
  19. java程序员用代码写的情书_一位Java程序员写给女友的情书
  20. 毕业设计 英雄联盟数据分析与预测 -大数据分析 可视化 机器学习

热门文章

  1. IDEA下SpringBoot项目的引用类没问题却提示:java:找不到符号:类**位置:程序包
  2. C#中File类的常用读取与写入文件方法的使用
  3. linux防火墙怎么添加端口,手工添加Linux防火墙端口
  4. 最新发布丨金融新基建系列报告:银行业六大中期趋势展望
  5. 行业精英聚首谈智慧营销:团队打造、管理策略、权力分配、成功因素、IT 治理……...
  6. IBM 火雪挺:人工智能如何影响衣食住行?
  7. BAT Android面试专题深入探究:四大组件+ViewPager+组件化架构+Bitmap
  8. SQL Server 2008 开启远程连接
  9. C#变量命名的几种方式—C#基础回顾
  10. JPA Hibernate应用实例