似然函数与极大似然估计

标签(空格分隔): ML

似然函数

  随机变量XXX的概率分布已知,但是这个分布的参数是未知的,需要我们去估计,我们把他记作θ\thetaθ,好比在抛硬币的试验中,硬币正面朝上的概率是未知的,需要我们去估计,那么此时θ\thetaθ就代表了这个待估计的正面向上的概率值。

  随机变量XXX的取值xix_ixi​表示抛掷kkk次硬币,正面向上的次数,那么这个概率表示为:
P({X=xi})=Ckxiθxi(1−θ)k−xiP(\{X=x_i\}) = C_k^{x_i}\theta^{x_i}(1-\theta)^{k-x_i}P({X=xi​})=Ckxi​​θxi​(1−θ)k−xi​

  这里需要注意的是,kkk和xix_ixi​都是指定的、已知的,而参数θ\thetaθ是一个未知参数。因此在这个大的背景下,抛掷kkk次,其中有xix_ixi​次向上的概率是关于一个未知参数θ\thetaθ的函数,我们把他写作是P({X=xi})=p(xi;θ)P(\{X=x_i\}) = p(x_i;\theta)P({X=xi​})=p(xi​;θ)。

  那么此时,我们做nnn次这种实验,每次实验中,都是连续抛掷kkk次硬币,统计正面出现的次数,这样就能取得一系列的样本:x1,x2,x3,…,xnx_1,x_2,x_3,\dots,x_nx1​,x2​,x3​,…,xn​,这些样本的取值之间满足相互独立,那么这一串样本取得上述取值{X1=x1,X2=x2,X3=x3,…,Xn=xn}\{X_1=x_1,X_2=x_2,X_3=x_3,\dots,X_n=x_n\}{X1​=x1​,X2​=x2​,X3​=x3​,…,Xn​=xn​}的联合概率为:
p(x1;θ)⋅p(x2;θ)⋅p(x3;θ)⋅⋯⋅p(xn;θ)p(x_1;\theta)\cdot p(x_2;\theta)\cdot p(x_3;\theta)\cdot\dots\cdot p(x_n;\theta)p(x1​;θ)⋅p(x2​;θ)⋅p(x3​;θ)⋅⋯⋅p(xn​;θ),用连乘符号写起来就是∏i=1np(xi;θ)\prod \limits_{i=1}^n p(x_i;\theta)i=1∏n​p(xi​;θ)
  这是一个通用的表达式,实际上,他的未知数就是一个θ\thetaθ,而其他的xix_ixi​都是已知的样本值。
  由此,我们更换一个更加有针对性的写法:
L(θ)=L(x1,x2,x3,…,xn;θ)=∏i=1np(xi;θ)L(\theta) = L(x_1,x_2,x_3,\dots,x_n;\theta) = \prod \limits_{i=1}^n p(x_i;\theta)L(θ)=L(x1​,x2​,x3​,…,xn​;θ)=i=1∏n​p(xi​;θ)

  那么,L(θ)=L(x1,x2,x3,…,xn;θ)L(\theta) = L(x_1,x_2,x_3,\dots,x_n;\theta)L(θ)=L(x1​,x2​,x3​,…,xn​;θ)就是这一串已知样本值x1,x2,x3,…,xnx_1,x_2,x_3,\dots,x_nx1​,x2​,x3​,…,xn​的似然函数,它描述了取得这一串指定样本值的概率值,而这个概率值完全由未知参数θ\thetaθ决定。这就是似然函数的由来。

  当然如果XXX 是一个连续型的随机变量,我们只要相应的把离散型的概率质量函数替换成连续型的概率密度函数即可:
L(θ)=L(x1,x2,x3,…,xn;θ)=∏i=1nf(xi;θ)L(\theta) = L(x_1,x_2,x_3,\dots,x_n;\theta) = \prod \limits_{i=1}^n f(x_i;\theta)L(θ)=L(x1​,x2​,x3​,…,xn​;θ)=i=1∏n​f(xi​;θ)

极大似然估计:

  有了似然函数,我们就可以用似然函数来估计模型的参数了。我们要估计的模型的参数就是使似然函数取极大值的参数。
  那么问题就很简单了,对似然函数求导,使得导数为0的θ\thetaθ的取值,就是我们要找的极大似然估计值θ^\hat{\theta}θ^。

  由于涉及到概率的连乘,而概率值都在[0,1][0,1][0,1]之间,因此,概率的连乘将会变成一个很小的值,可能会引起浮点数下溢,尤其是当数据集很大的时候,联合概率会趋向于0,非常不利于之后的计算。
  所以我们通常会对似然函数取对数(f(x)f(x)f(x)转化为ln(f(x))ln(f(x))ln(f(x))),因为对数函数单调递增的性质,所以
p(x∣θ1)>p(x∣θ2)⇔ln⁡p(x∣θ1)>ln⁡p(x∣θ2)p(x|\theta_1) > p(x|\theta_2) \Leftrightarrow \ln p(x|\theta_1) > \ln p(x|\theta_2)p(x∣θ1​)>p(x∣θ2​)⇔lnp(x∣θ1​)>lnp(x∣θ2​),因此似然函数的极大值与取对数后的似然函数的极大值是一样的,但是对于求解更方便,这样连乘就变成了连加。
  此时再对它求导就变的容易了,如果方程有唯一解,且是极大值点,那么我们就求得了极大似然估计值。
  如果有多个未知参数时,可以用偏导数分别对其求导,并建立方程组,最后解得这个方程组就可以了。

参考资料

如何理解似然函数
似然函数与极大似然估计

似然函数与极大似然估计相关推荐

  1. 似然函数的意义与极大似然估计

    什么是概率? 简单来说,概率是一个函数,定义域是样本空间,满足非负性,规范性,可列可加性. 严格的公理化定义如下: 概率可以做什么?统计又可以做什么? 什么是先验概率,后验概率,似然? 先验概率:根据 ...

  2. 7.2 极大似然估计

    7.2 极大似然估计 ​ 估计类条件概率的一种常用策略是先假设其具有某种确定的概率分布形式,然后再基于训练样本对概率分布的参数进行估计,具体的说,记关于类别C的类条件概率为P(X|C),假设P(X|C ...

  3. 【数学基础】参数估计之极大似然估计

    背景 先来看看几个小例子: 猎人师傅和徒弟一同去打猎,遇到一只兔子,师傅和徒弟同时放枪,兔子被击中一枪,那么是师傅打中的,还是徒弟打中的? 一个袋子中总共有黑白两种颜色100个球,其中一种颜色90个, ...

  4. 伽马分布极大似然估计_一文通俗解释极大似然估计

    我们都知道机器学习的大致流程是通过建立一个合理的模型学习现有数据集,然后通过该模型去完成特定的任务.其中每个模型都包含自身的一组特定参数,而这组参数决定着模型的本身.但这里存在一个很关键的一个问题,就 ...

  5. LR为什么用极大似然估计,损失函数为什么是log损失函数(交叉熵)

    首先,逻辑回归是一个概率模型,不管x取什么值,最后模型的输出也是固定在(0,1)之间,这样就可以代表x取某个值时y是1的概率 这里边的参数就是θ,我们估计参数的时候常用的就是极大似然估计,为什么呢?可 ...

  6. 机器学习笔记1.矩估计、极大似然估计。

    1.矩估计 1.1矩估计思想: 矩估计是基于一种简单的"替换"思想,即用样本矩估计总体矩 1.2矩估计理论: 矩估计的理论依据就是基于大数定律的,大数定律语言化表述为:当总体的k阶 ...

  7. R语言-回归系数的极大似然估计

    老师要求我们对回归方程中的回归系数进行极大似然估计,回归方程如下: 计算步骤如下: 步骤一:写出似然函数log(β),其中的β为(β0,β1,β2)t(β_0, β_1, β_2)^t(β0​,β1​ ...

  8. 通俗理解极大似然估计

    维基百科:在统计学中,最大似然估计(英语:Maximum Likelihood Estimation,简作MLE),也称极大似然估计,是用来估计一个概率模型的参数的一种方法 极大似然估计,通俗理解来说 ...

  9. 求解极大似然估计,一共有几步?

    前提知识 阅读本文之前,需要了解似然函数相关的概念,详见另一篇文章 如何通俗地理解"最大似然估计法"? 极大似然估计的目的就是:利用已知的样本结果,反推最有可能(最大概率)导致这样 ...

最新文章

  1. ??ArcGIS server公交线路动态分段问题
  2. python 数据分析
  3. Java后台获取前端传递的日期解析不了
  4. boost::container实现显式实例静态向量测试程序
  5. Django从理论到实战(part50)--使用模型来处理上传的文件
  6. android4.0 菜单,三大主流安卓4.0界面解析 MIUI最实用
  7. C# 通过socket实现UDP 通信
  8. 方法文件Matlab调用动态链接库
  9. android 获取sd卡视频文件名,android – 如何获取SD卡上的视频列表
  10. 华为机试HJ23:删除字符串中出现次数最少的字符
  11. Java 学习笔记:第十一章 多线程技术
  12. 爬虫实例 8684公交网-太原公交线路信息
  13. 网站备案各个管局的审核时间多久?
  14. 2021-09-23记录下wifi调试流程
  15. android createbitmap设置背景色,Android createBitmap截取实现移动的游戏背景
  16. 计算机上做报纸模板,word中怎么制作报纸排版模板
  17. 容灾备份概念及实现方式
  18. 钢条切割算法python实现
  19. 悼念512汶川大地震遇难同胞——珍惜现在,感恩生活 dp
  20. 前端程序员忙里偷闲入门一波SpringBoot

热门文章

  1. 2022-2028年中国亲子装行业市场调查研究及投资策略研究报告
  2. HTMl中a标签的用法
  3. 反爬虫微信文章(总结)
  4. 举例说明儿化音的作用_儿化韵有何作用举例说明
  5. 约翰·霍普金斯医学院的声明
  6. 第十四篇 数据分析案例
  7. delphi 安卓图片保存数据库_在Delphi实现在数据库中存取图像的图文演示无错
  8. 移动安全 - 安全军火库调查
  9. Linux系统中进入退出vim编辑器
  10. 益达木糖醇广告歌曲英文版--Sitting by the side of the road