本文章由公号【开发小鸽】发布!欢迎关注!!!

老规矩–妹妹镇楼:

导言:

咱们学习概率论的时候,一定学习过最大似然估计这个概念,但是大家可能都只是学习了如何求解最大似然估计,而不太清楚什么叫似然估计?为什么要求最大的似然估计?估计是用于估计什么?这些问题可能大家都没有想过,也可能是因为教科书上的公式太多,没有清晰地讲解最大似然估计的用途。
       那么这篇文章就带大家来看看何为最大似然估计。这里我将最大似然估计分为“似然估计:,“最大”两个部分来讲解。

一. 似然估计

似然,英文名为likelihood,直译过来是可能性,可能这个时候大家就想到了概率(probability)这个词了。确实,两者在中文的意思上确实差不多,但在统计学中是两个完全不同的概念。

(一)概率

所谓概率,是指某件事在指定的环境下发生的几率
       如在环境A下,事件M发生的几率为 P(M/A)。
       在环境B下,事件M发生的几率为P(M/B)。
       将两个先验条件A和B整合为先验条件θ。则概率公式整合为:P(M/θ)。

(二)似然

       而似然,是指在确定事件M已经发生的条件下,我们来推测这件事M是由环境A造成的还是由环境B造成的。
       公式如下:L(θ/M),θ是先验条件。

       概率和似然看似是正好相反的两个概念,它们表示的其实是同一件事,只不过概率是用先验条件来推结果,而似然使用结果来推先验条件。但两者在数值上是相等的。
       P(M/θ) = L(θ/M)

二. 最大

       我们现在知道了似然估计的概念,知道了似然估计是从确定的结果M反推先验条件theta,那么所谓的最大似然估计是什么意思呢?
       正如我们之前所举的例子,先验条件有环境A和环境B(这是最简单的先验条件,实际应用复杂得多),我们要从结果M推测可能性最大的先验条件是环境A还是环境B,找出最大的theta,即找出造成结果M的最可能的条件,这也是我们生活中遇到的最多的情况。通常我们遇到问题,都要反推这个问题到底是由什么原因造成的?最大似然估计就是用来寻找造成问题的最可能的原因。

三.求解最大似然估计

(一).步骤

       了解了最大似然估计的概念,那么如何求解最大似然估计呢?这个问题我估计大家都做过,过程如下:

  1. 写出最大似然函数
  2. 对似然函数取对数
  3. 求导
  4. 解方程

(二).步骤分析

       这个流程大家应该或多或少都有些印象,可这些步骤是为什么呢?大家有想过么?我来分析一下。

1. 刚刚有说到,似然函数与概率虽然意思不一样,但是值是相等的。因此写出似然函数这一步,就是用概率来完成的。同时,我们求解的似然函数通常都会出现连乘的现象,因为现实的问题中有很多概率是独立的,用概率公式需要连乘。
       2.由于连乘很难求解啊,很容易想到用求对数的方法将连乘转换为连加,加减法当然比乘除法好做啊。同时用求对数的方法并不会改变函数的极值点与最大值的位置。
       3.我们需求解的是最大似然估计,求解最大值,大家应该第一个想到的都是求导,那么直接对公式求导。
       4.最后一步就是解方程了。

到这里,最大似然估计就被你求出来了,是不是有种醍醐灌顶的感觉呢?被教科书支配了那么多年,看了那么多公式,没有理解概念其实什么都记不住…

关注我,看更多机器学习解析,入门计算机视觉。

【机器学习笔记(十)】之通俗易懂理解到底最大似然估计是什么?相关推荐

  1. 机器学习笔记十四:随机森林

    在上一篇机器学习笔记十三:Ensemble思想(上)中,简要的提了一下集成学习的原理和两种主要的集成学习形式.  而在这部分要讲的随机森林,就算是其中属于bagging思路的一种学习方法.为了篇幅,b ...

  2. 机器学习概念:最大后验概率估计与最大似然估计 (Maximum posterior probability and maximum likelihood estimation)

    joey 周琦 假设有参数θ\theta, 观测x\mathbf{x}, 设f(x|θ)f(x|\theta)是变量xx的采样分布,θ\theta是其中的参数.那么θ\theta的最大似然估计可以表示 ...

  3. 如何理解「最大似然估计」?参数估计、似然函数、最大似然估计

    文章目录 引言 参数估计 最大似然估计 似然函数 求解最大似然估计问题 为什么要对似然函数取对数? "似然"与"概率"的区别 机器学习中的应用 参考资料 引言 ...

  4. 机器学习笔记(十)——这样推导SMO算法才易理解

    线性支持向量机 上一篇文章对支持向量机的间隔.对偶和KKT条件做了详细推导,但前文的基础是原始问题为线性可分问题,所以对线性不可分训练数据是不适用的,这时需要引入一个新定义:软间隔. 假如训练数据中有 ...

  5. 机器学习笔记(十五)规则学习

    15.规则学习 15.1基本概念 机器学习中的规则(rule)通常是指语义明确.能描述数据分布所隐含的客观规律或领域概念.可写成若-则-形式的逻辑规则.规则学习(rulelearning)是从训练数据 ...

  6. 机器学习笔记(十)降维和度量学习

    10.降维和度量学习 10.1k近邻学习 k近邻(k-NearestNeighbor,简称kNN)学习是一种常用的监督学习方法,其原理是:给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练 ...

  7. 机器学习笔记(十二)计算学习理论

    12.计算学习理论 12.1基础知识 计算学习理论(computationallearning theory)研究的是关于通过计算来进行学习的理论,即关于机器学习的理论基础,其目的是分析学习任务的困难 ...

  8. 机器学习笔记 十九:由浅入深的随机森林模型之分类

    随机森林学习内容 1. 集成学习 2.sklearn中的集成算法 2.1 sklearn中的集成算法模块ensemble 2.2 RandomForestClassifier 2.2.1 参数 2.2 ...

  9. 机器学习笔记 十四:k-近邻算法(kNN)的实现

    目录 1. 什么是机器学习 2. k-近邻算法(kNN) 2.1 kNN的原理 2.2 k-近邻算法的一般流程 2.3 kNN伪代码 3. 函数介绍 3.1 get()函数:利用字典统计列表中元素出现 ...

最新文章

  1. python linux系统管理与自动化运维_《Python Linux系统管理与自动化运维》赖明星著【摘要 书评 在线阅读】-苏宁易购图书...
  2. C# web api 中过滤器的使用
  3. 最早做无糖茶的统一茶里王,是怎样错过年轻人的?
  4. Iptables入门教程
  5. 车牌识别之车牌定位(方案总结)
  6. 【CF#148B】Escape(模拟)
  7. 接入上文,StarWind V2V Image Converter:虚拟机镜像转换工具,如何使用转化之后的 VMware VMDK 文件
  8. 20-400-040-高可用-Flink集群的高可用搭建
  9. Python+Pandas 读取Oracle数据库
  10. tomcat异常[0]--java.lang.ClassNotFoundException: org.apache.taglibs.standard.tlv.JstlCoreTLV
  11. 用a卡还是n卡_谁是玩家最爱的显卡?N卡优势太大,GTX 1060秒A卡全家
  12. Chrome浏览器启动命令行参数大全
  13. 期货交易常用术语中英文对照表
  14. win7计算机自动关机设置在哪里设置方法,win7电脑自动关机怎么设置_win7电脑自动关机怎么设置在哪-win7之家...
  15. 滴滴CTO张博港科大演讲:详解未来交通变革的三层“折叠”
  16. 各种数据类型的取值范围
  17. N32G457VEL7移植FreeRTOS代码
  18. 使用百度地图API实现地图生成、标记以及标注
  19. Vue 使用echarts 地图自定义图标和修改图标样式,点击切换图标
  20. PTA 7-192 浪漫的表白

热门文章

  1. AutoSAR MemMap模块实例解析及注意事项
  2. STM32G0+EMW3080+阿里云实现单片机WiFi智能联网功能(一)EMW3080实现和PC之间的串口通讯
  3. RHEL6.4启动一直在加载界面,无法进入图形化界面的解决办法
  4. 运维之道 | SCP:Linux服务器之间传输目录文件
  5. tv正则化的泊松去噪模型matlab,实例:Tikhonov 正则化模型用于图片去噪
  6. 结构化开发方法和面向对象开发方法的比较
  7. 知道服务器地址上传网页文件,修改的网页怎么上传到服务器地址
  8. 投行说所有人都严重低估了AI 英伟达股价应声暴涨
  9. IntelliJ IDEA快捷键最全整理
  10. mac录屏软件:ScreenFlow for Mac中文版