最大似然估计说的就是,如果事情发生了,那必然是概率最大的。
我们假设硬币有两面,一面是“花”,一面是“字”。
一般来说,我们都觉得硬币是公平的,也就是“花”和“字”出现的概率是差不多的。
如果我扔了100次硬币,100次出现的都是“花”。
在这样的事实下,我觉得似乎硬币的参数不是公平的。你硬要说是公平的,那就是侮辱我的智商。
这种通过事实,反过来猜测硬币的情况,就是似然
而且,我觉得最有可能的硬币的情况是,两面都是“花”:

通过事实,推断出最有可能的硬币情况,就是最大似然估计

1 概率vs似然

让我们先来比较下概率和似然。
为了避免和我们想讨论的概率混淆,我们把硬币的“花”出现的概率称为硬币的参数。

1.1 概率

已知硬币的参数,就可以去推测抛硬币的各种情况的可能性,这称为概率
比如已知硬币是公平的,也就是硬币的参数为0.5。
那么我们就可以推测,扔10次硬币,出现5次“花”朝上的概率为(抛硬币遵循二项分布,这个就不多解释了):

1.2 似然

正如开头所说,我们对硬币的参数并不清楚,要通过抛硬币的情况去推测硬币的参数,这称为似然
可以再举不那么恰当(主要模型不好建立)的例子,蹭下热点。
比如我们发现,鹿晗和关晓彤戴同款手链,穿同款卫衣:
我们应该可以推测这两人关系的“参数”是“亲密”。
进一步发现,两人在同一个地方跨年:
似乎,关系的“参数”是“不简单”。
最后,关晓彤号称要把初吻留给男友,但是最近在荧幕中献出初吻,对象就是鹿晗:
我觉得最大的可能性,关系的“参数”是“在一起”。
通过证据,对两人的关系的“参数”进行推断,叫做似然,得到最可能的参数,叫做最大似然估计

2 最大似然估计

来看看怎么进行最大似然估计。

2.1 具体的例子

我们实验的结果是,10次抛硬币,有6次是“花”。
所谓最大似然估计,就是假设硬币的参数,然后计算实验结果的概率是多少,概率越大的,那么这个假设的参数就越可能是真的。
我们先看看硬币是否是公平的,就用0.5作为硬币的参数,实验结果的概率为:

单独的一次计算没有什么意义,让我们继续往后面看。
再试试用0.6作为硬币的参数,实验结果的概率为:

之前说了,单次计算没有什么意义,但是两次计算进行比较就有意义了。
可以看到:

我们可以认为,0.6作为参数的可能性是0.5作为参数的可能性的1.2倍。

2.2 作图

我们设硬币的参数为θ\thetaθ,可以得到似然函数为:

这样我们就可以作图了:

我们可以从图中看出两点:

  1. 参数为0.6时,概率最大
  2. 参数为0.5、0.7也是有可能的,虽然可能性小一点

所以更准确的说,似然(现在可以说似然函数了)是推测参数的分布。
而求最大似然估计的问题,就变成了求似然函数的极值。在这里,极值出现在0.6。

2.3 更多的实验结果

如果实验结果是,投掷100次,出现了60次“花”呢?似然函数为:

用0.5作为硬币的参数,实验结果的概率为:

再试试用0.6作为硬币的参数,实验结果的概率为:

此时:

此时,0.6作为参数的可能性是0.5作为参数的可能性的8倍,新的实验结果更加支持0.6这个参数。
图像为:

很明显图像缩窄了,可以这么解读,可选的参数的分布更集中了。越多的实验结果,让参数越来越明确。

2.4 更复杂一些的最大似然估计

2.4.1 数学名词

下面提升一点难度,开始采用更多的数学名词了。先说一下数学名词:

  • 一次实验:抛硬币10次,出现6次“花”,就是一次实验。
  • 二项分布:抛硬币10次,出现6次“花”的概率为0.25,出现5次“花”的概率为0.21,所有的可能的结果(比如抛硬币10次,出现11次“花”,这就是不可能)的概率,放在一起就是二项分布

2.4.2 多次实验

之前的例子只做了一次实验。只做一次实验,没有必要算这么复杂,比如投掷100次,出现了60次“花”,我直接:

不就好了?最大似然估计真正的用途是针对多次实验。

2.4.3 上帝视角

为了说清楚这个问题,我引入一个上帝视角。
比如,我有如下的二项分布,\theta为出现“花”的概率(硬币抛10次):

在实际生活中,\theta往往是不知道的,这里你可以看得到,就好像你是上帝一样。
要提醒大家注意的一点,上面的图像只有上帝才能看到的,包括:

  • 二次分布的柱状图
  • 二次分布的曲线图
  • θ\thetaθ值为多少
    我把只有上帝能看到的用虚线表示,θ\thetaθ用淡一点的颜色表示:

2.4.4 通过多次实验进行最大似然估计

上面的二项分布用通俗点的话来说,就是描述了抛10次硬币的结果的概率,其中,“花”出现的概率为\theta。
根据上面的二项分布,我进行了6次实验(也就是总共6次,每次抛10次硬币),把实验结果用点的形式标记在图像上(从技术上讲,这6个点是根据二项分布随机得到的):

这个实验结果,也就是图上的点,是我们“愚蠢的人类”可以看见的了。
可以看到,虽然进行了6次实验,但是却没有6个点,这是因为有的实验结果是一样的,就重合了。
为了方便观察,我把6个点的值用文字表示出来:

上图中的{4,5,5,2,7,4}就是6次实验的结果,分别表示:

  • 第一次实验,4次出现“花”
  • 第二次实验,5次出现“花”
  • 第三次实验,5次出现“花”
  • 以此类推
    我们用x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1​,x2​,⋯,xn​表示每次实验结果,因为每次实验都是独立的,所以似然函数可以写作(得到这个似然函数很简单,独立事件的联合概率,直接相乘就可以得到):


    表示在同一个参数下的实验结果,也可以认为是条件概率。
    下面这幅图,分为两部分,上面除了实验结果外,都是上帝看到的,而下面是通过实验结果,利用似然函数对θ\thetaθ值的推断:

3.其它极大似然估计的例子

3.1 简单案例热身

3.2 单参数极大似然估计

3.3.多参数极大似然估计


参考资料
https://www.zhihu.com/question/24124998

[概率论]如何通俗地理解“最大似然估计法”?相关推荐

  1. 如何通俗的理解最大似然估计法

      一枚硬币有两面,一般来讲,抛一枚硬币出现正面和反面的概率是差不多的.假如我抛了100次硬币,结果100次都是正面.在这样的事实下,这枚硬币的参数不是公平的,即参数不是0.5.如果你硬要说是公平的, ...

  2. 如何通俗地理解“极大似然估计”?

    博客内容搬运自https://www.matongxue.com/madocs/447.html 前言 最大似然估计说的就是,如果事情发生了,那必然是概率最大的. 一般来说,我们都觉得硬币是公平的,也 ...

  3. “损失函数”是如何设计出来的?直观理解“最小二乘法”和“极大似然估计法”

    [本文内容是自对视频:"损失函数"是如何设计出来的?的整理.补充和修正] 在大多数课程,尤其是帮助大家快速掌握深度学习的课程,损失函数似乎并不是一个需要额外关心的问题.因为它往往都 ...

  4. 极大似然估计法的理解和用途

      在机器学习的算法中,经常看到极大似然估计的身影,不接触数学一段时间的我,对它又熟悉又陌生,还是决定系统的写一下极大似然估计的思想.   极大似然估计法是求点估计的常用方法之一.极大似然估计法是建立 ...

  5. 【白话理解神经网络中的“损失函数”——最小二乘法和极大似然估计法】

    目录 写在前面的话 理解损失函数 最小二乘法 最大似然估计法(统计方法) 写在前面的话 "损失函数"是如何设计出来的?直观理解"最小二乘法"和"极大似 ...

  6. 最大似然估计法 通俗详解

    1. 来源: 考虑一个问题: 盒子里面有球10个形状一样的球(10红球和0蓝球,但看不到),可以拿一个,看完颜色又放回去.拿了10次,每次都看到红球.你猜猜盒子里面有几个红球,几个蓝球? 例如盒子里面 ...

  7. 如何理解最大似然估计?

    转载自:最大似然估计总结笔记,小编辛辛苦苦对原文进行了文字和公式的润色. 如何理解最大似然估计? 1.作用 在已知实验结果的情况下,用来估计满足这些样本分布的参数,把可能性最大的那个参数 θ \the ...

  8. 点估计(矩估计法和最大似然估计法)

    估计即是近似地求某个参数的值,需要区别理解样本.总体.量.值 大致的题型是已知某分布(其实包含未知参数),从中取样本并给出样本值 我只是一个初学者,可能有的步骤比较繁琐,请见谅~ 1.矩估计法 做题步 ...

  9. 机器学习数学原理(1)——极大似然估计法

    机器学习数学原理(1)--极大似然估计法 事实上机器学习的大部分算法都是以数理统计和概率论为理论基础构建的.笔者在学习机器学习的过程中,意识到其实机器学习中的很多假设背后都是有着数学原理支撑的,从而使 ...

最新文章

  1. 【Leetcode】【Medium】Rotate Image
  2. java桌面应用程序打包为exe
  3. 怎么把mysql表里的时间往后推移_Mysql实战45讲笔记:2、更新语句的执行以及日志...
  4. 图片优化_网站里的图片应该如何优化
  5. python的遍历字典里的键然后放到一个列表里_Python列表和字典互相嵌套怎么办?看完让你没有疑惑...
  6. python与mysql数据库如何连接_如何连接Python中的MySQL数据库?
  7. leetcode python3 简单题13. Roman to Integer
  8. 表中存在类型为dateTime的字段,并且插入语句,不包括该字段时,会插入失败...
  9. JAVA 大数运算模板 ACM竞赛必备
  10. C#基础笔记(第十天)
  11. jquery做一个表单验证
  12. CentOS6.5 开启防火墙iptables端口,如3306,8080
  13. R语言 伯努利试验和二项分布
  14. CocosCreator之KUOKUO带你做刚体移动与物品拾取到背包
  15. 自主招生计算机网测考什么,自主招生考试内容有哪些 考哪几门
  16. OneNET EDP协议讲解与应用
  17. 扫地机器人自动回充原理
  18. 两种WIFI破解的方法
  19. Python基础学习(十二)标准库
  20. 真香!java设置全局变量

热门文章

  1. Nmap系列C------OSI二层扫描
  2. SQL Case When Then
  3. Linux/Windows/MacOS各个操作系统下推荐应用集合
  4. 面试官系统精讲Java源码及大厂真题 - 47 工作实战:Socket 结合线程池的使用
  5. 创建设计模式 - 工厂设计模式
  6. Promise.all 处理error
  7. 【Liunx】manjaro双系统安装(折腾)教程
  8. PHPStorm开启Debug
  9. 如何使用Docker Volumes在基于Docker的应用程序上启用实时重新加载
  10. 147_Power BI Report Server demo演示