在开始接触最大似然估计和贝叶斯估计时,大家都会有个疑问:最大似然估计和贝叶斯估计二者很相似,到底有何区别?本文便来说说二者的不同之处以及求参模型的公式推导!

预热知识必知

如何求类条件概率密度:
我们知道贝叶斯决策中关键便在于知道后验概率,那么问题便集中在求解类条件概率密度!那么如何求呢?答案便是:将类条件概率密度进行参数化。

最大似然估计和贝叶斯估计参数估计:
鉴于类条件概率密度难求,我们将其进行参数化,这样我们便只需要对参数进行求解就行了,问题难度将大大降低!比如:我们假设类条件概率密度p(x|w)是一个多元正态分布,那么我们就可以把问题从估计完全未知的概率密度p(x|w)转化成估计参数:均值u、协方差ε

所以最大似然估计和贝叶斯估计都属于参数化估计!……当然像KNN估计、Parzen窗这些就是非参数话估计啦!但是参数化估计也自然有它的缺点,下面会说的!

简述二者最大的区别

若用两个字高度概括二者的最大区别那就是:参数

最大似然估计和贝叶斯估计最大区别便在于估计的参数不同,最大似然估计要估计的参数θ被当作是固定形式的一个未知变量,然后我们结合真实数据通过最大化似然函数来求解这个固定形式的未知变量!

贝叶斯估计则是将参数视为是有某种已知先验分布的随机变量,意思便是这个参数他不是一个固定的未知数,而是符合一定先验分布如:随机变量θ符合正态分布等!那么在贝叶斯估计中除了类条件概率密度p(x|w)符合一定的先验分布,参数θ也符合一定的先验分布。我们通过贝叶斯规则将参数的先验分布转化成后验分布进行求解!

同时在贝叶斯模型使用过程中,贝叶斯估计用的是后验概率,而最大似然估计直接使用的是类条件概率密度。

下面会详细分析最大似然估计和贝叶斯估计求解模型!

从其他方面谈谈二者的异同

在先验概率能保证问题有解的情况下,最大似然估计和贝叶斯估计在训练样本趋近于无穷时得到的结果是一样的!但是实际的模式识别问题中,训练样本总是有限的,我们应如何选择使用哪种模型呢?下面简单分析分析:

(1) 计算复杂度:就实现的复杂度来说,肯定是有限选择最大似然估计,最大似然估计中只需要使用到简单的微分运算即可,而在贝叶斯估计中则需要用到非常复杂的多重积分,不仅如此,贝叶斯估计相对来说也更难理解;

(2)准确性:当采用的样本数据很有限时,贝叶斯估计误差更小,毕竟在理论上,贝叶斯估计有很强的理论和算法基础。

参数化估计的缺点:
贝叶斯估计和最大似然估计都是属于参数化估计,那么二者存在着一个共同的缺点:参数化估计虽然使得类条件概率密度变得相对简单,但估计结果的准确性严重依赖于所假设的概率分布形式是否符合潜在的真实数据分布。在现实应用中,与做出能较好的接近潜在真实分布中的假设,往往需要一定程度上利用关于应用任务本身的经验知识,否则若仅凭“猜测”来假设概率分布形式,很可能产生误导性的结果!所以没有什么算法是十全十美的啦!

下面便推导一下最大似然估计和贝叶斯估计所使用的模型,最大似然简单些,贝叶斯估计就比较复杂了!

最大似然估计模型推导

假设样本集D={x1 、x2 、…、xn},假设样本之间都是相对独立的,注意这个假设很重要!于是便有:


所以假设似然函数为:

接下来我们求参的准则便是如名字一样最大化似然函数喽:

下面有一个优化,专业名词为 拉布拉斯修正

简单说:就是防止先验概率为0,那么上面的L(θ|D)整个式子便都成0 了,那肯定是不行的啊,不能因为一个数据误差影响了整个数据的使用。同时那么多先验概率相乘,可能出现下溢出。所以引入拉普拉斯修正,也就是取对数ln,想必大家在数学中都用过这种方法的。

所以做出下面变换:

所以最大化的目标便是:

求解上面问题便不多说了,使用数学中的微分知识便可:


然后使得偏导数为0:

自此便求出了参数θ,然后便得到了类条件概率密度,便可进行判别等接下来的工作了。

下面讲解贝叶斯模型推导,略微复杂些,下伙伴们仔细看啊!

贝叶斯估计模型推导

先说一句,贝叶斯估计最终也是为了得出后验概率。所以贝叶斯最终所要的得到推导的是:


正如上面所说我们便是要参数的先验分布通过贝叶斯规则转化成后验概率,也就是上面这个公式,接下来我们一起看看如何推导出上面后验概率的公式通过参数的先验概率。

上式中有:


带入后验概率的式子可得:

大家注意啦!!!这里也有个重要的假设,那就是样本之间是相互独立的,同时类也是相互独立的。所以有如下假设:


同时由于类之间相互独立,所以我们不用区分类了,便有:

这里给大家顺一下思路,所以我们要求后验概率便是要求出P(x|D)便可:
下面说明P(x|D)的推导:

正如我们前面所说上式中p(x| θ),我们假设它是一个已知的满足一定先验分布的,我们现在便是要知道:

下面给出其推导过程:

对于上式中的P(D|θ),还记得上面说的很重要的样本之间是独立的吗,所以和最大似然函数类似有:


因此最终我们便可以求得P(x|D):

这样我们将P(x|D)待会后验概率的式子便可求出后验概率了,所以我们完成了上面的说法,便是将参数θ 服从的先验概率分布转化成了后验概率分布了。

本文参考资料:
【1】Pattern Classification Second Edition
【2】Machine Learining in Action
【3】机器学习 著周志华

贝叶斯估计和极大似然估计相关推荐

  1. 伽马分布极大似然估计_一文通俗解释极大似然估计

    我们都知道机器学习的大致流程是通过建立一个合理的模型学习现有数据集,然后通过该模型去完成特定的任务.其中每个模型都包含自身的一组特定参数,而这组参数决定着模型的本身.但这里存在一个很关键的一个问题,就 ...

  2. 贝叶斯网专题11:参数学习之极大似然估计

    第一部分:贝叶斯网基础 1.1 信息论基础 1.2 贝叶斯网基本概念 1.3 变量独立性的图论分析 第二部分:贝叶斯网推理 2.1 概率推理中的变量消元方法 2.2 团树传播算法 2.3 近似推理 2 ...

  3. 千字讲解极大似然估计

    上周有读者私信我说,面试被问到了极大似然估计没回答出来,虽然网上有很多讲解,但是不大能看得懂,而且有一些疑问没有解释清楚.经过一周的撰写,今天困哥就专门整理了一篇数千字的文章,来详细介绍一下极大似然估 ...

  4. 干货 | 一文搞懂极大似然估计

    极大似然估计,通俗理解来说,就是在假定整体模型分布已知,利用已知的样本结果信息,反推最具有可能(最大概率)导致这些样本结果出现的模型参数值! 换句话说,极大似然估计提供了一种给定观察数据来评估模型参数 ...

  5. 零基础掌握极大似然估计

    零基础掌握极大似然估计 https://mp.weixin.qq.com/s/v98qGCz_qN_73hnYKrCQFw 1极大似然估计 极大似然估计,通俗理解来说,就是在假定整体模型分布已知,利用 ...

  6. 极大似然估计_计量经济学 | 极大似然估计

    写在前面:本文写作于被新冠病毒 (COVID-19) 笼罩下的英国.前段时间本人的恩师.苏格兰老爷爷.英国伯明翰大学Emeritus讲席教授Peter Sinclair确诊新冠病毒,实乃不幸.在此祝P ...

  7. 7.2 极大似然估计

    7.2 极大似然估计 ​ 估计类条件概率的一种常用策略是先假设其具有某种确定的概率分布形式,然后再基于训练样本对概率分布的参数进行估计,具体的说,记关于类别C的类条件概率为P(X|C),假设P(X|C ...

  8. 【数学基础】参数估计之极大似然估计

    背景 先来看看几个小例子: 猎人师傅和徒弟一同去打猎,遇到一只兔子,师傅和徒弟同时放枪,兔子被击中一枪,那么是师傅打中的,还是徒弟打中的? 一个袋子中总共有黑白两种颜色100个球,其中一种颜色90个, ...

  9. LR为什么用极大似然估计,损失函数为什么是log损失函数(交叉熵)

    首先,逻辑回归是一个概率模型,不管x取什么值,最后模型的输出也是固定在(0,1)之间,这样就可以代表x取某个值时y是1的概率 这里边的参数就是θ,我们估计参数的时候常用的就是极大似然估计,为什么呢?可 ...

最新文章

  1. zabbix3.4.7版本饼图显示问题
  2. C# 入门经典示例.
  3. 页面异常反dump 及 内存访问异常hook
  4. Java Iterator 接口简介和简单用法.
  5. Git 内部原理图解——对象、分支以及如何从零开始建仓库
  6. 阿里宜搭重磅发布专有云版本、精品应用市场,助力政企数字化转型
  7. python基础代码技巧_Python 代码优化技巧(二)
  8. LeetCode刷题(简单)笔记C++
  9. 【iCore4 双核心板_ARM】例程十八:USBD_VCP实验——虚拟串口
  10. 电商平台的系统组织架构
  11. cad2020直装版无需注册机
  12. CHD-5.3.6集群安装
  13. Android修行手册-看看Button都有哪些属性?
  14. 关联分析(Association Analysis)--挖掘啤酒与尿布的关联规则
  15. CSS设置背景铺满屏幕且不重复
  16. 家庭中的交换机如何选择?几种常见的交换机选择避坑方法需要知道
  17. html怎么实现计算bmi,利用Javascript实现BMI计算器
  18. Oracle12C--触发器(52)
  19. 榛子外观缺陷视觉检测系统
  20. 各种常用的JSON接口,天气,手机归属地,IP地理位置,QQ空间,优酷,微博,等

热门文章

  1. string类比较大小_源码阅读String--JAVA成长之路
  2. 【英语学习】【WOTD】muse 释义/词源/示例
  3. 【英语学习】【WOTD】heartstring 释义/词源/示例
  4. Intel(R) 处理器产品型号/CPUID标识/签名对照表 (Family Model)
  5. Intel 64/x86_64/x86/IA-32处理器操作模式/运行模式
  6. Games101 计算机图形学课程笔记: Lecture14 Ray Tracing 2
  7. epoll示例程序——服务端
  8. 国外大学生谈经验:如何在Github参与开源(Open Source on Github: Your First Contribution)
  9. 如何使用Xcode分析调试在真机运行的UE4 IOS版游戏
  10. 不可求的电脑上必备软件,你也许听过