http://blog.csdn.net/pipisorry/article/details/51461997

最大似然估计MLE

顾名思义,当然是要找到一个参数,使得L最大,为什么要使得它最大呢,因为X都发生了,即基于一个参数发生的,那么当然就得使得它发生的概率最大。

最大似然估计就是要用似然函数取到最大值时的参数值作为估计值,似然函数可以写做

Note: p(x|theta)不总是代表条件概率;也就是说p(x|theta)不代表条件概率时与p(x;theta)等价,而一般地写竖杠表示条件概率,是随机变量;写分号p(x; theta)表示待估参数(是固定的,只是当前未知),应该可以直接认为是p(x),加了;是为了说明这里有个theta的参数,p(x; theta)意思是随机变量X=x的概率。在贝叶斯理论下又叫X=x的先验概率。相乘因为它们之间是独立同分布的。

MLE通常使用对数似然函数

使用log-likelihood比原始函数好的原因:

1 由于有连乘运算,通常对似然函数取对数计算简便,即对数似然函数。it's kind of analytically nice to work with log-likelihood.

2 multiplying small numbers the numerical errors start to add up and start to propagate.If we are summing together small numbers,the numerical errors are not so serious.

3 log函数是单调的,所有东西保持不变。

最大似然估计问题可以写成

这是一个关于的函数,求解这个优化问题通常对求导,得到导数为0的极值点。该函数取得最大值是对应的的取值就是我们估计的模型参数。

给定观测到的样本数据,一个新的值发生的概率是

求出参数值不是最终目的,最终目的是去预测新事件基于这个参数下发生的概率。

Note: 注意有一个约等于,因为他进行了一个近似的替换,将theta替换成了估计的值,便于计算。that is, the next sample is anticipated to be distributed with the estimated parameters θ ˆ ML .

扔硬币的伯努利实验示例

以扔硬币的伯努利实验为例子,N次实验的结果服从二项分布,参数为P,即每次实验事件发生的概率,不妨设为是得到正面的概率。为了估计P,采用最大似然估计,似然函数可以写作

其中表示实验结果为i的次数。下面求似然函数的极值点,有

得到参数p的最大似然估计值为

可以看出二项分布中每次事件发的概率p就等于做N次独立重复随机试验中事件发生的概率。

如果我们做20次实验,出现正面12次,反面8次,那么根据最大似然估计得到参数值p为12/20 = 0.6。

[Gregor Heinrich: Parameter estimation for text analysis*]

MLE的一个最简单清晰的示例

皮皮blog

最大似然估计MLE

能最大化已观测到的观测序列的似然的参数就是估计的参数值。

图钉的例子

为不同参数theta的可能值打分并选择的一种标准

一般情况下的MLE

最大似然准则

参数模型和参数空间

似然函数的定义

充分统计量

MLE的注解

MLE的缺陷:置信区间

似然函数度量了参数选择对于训练数据的影响。

似然函数的要求

[《Probabilistic Graphical Models:Principles and Techniques》(简称PGM)]

皮皮blog
from: http://blog.csdn.net/pipisorry/article/details/51461997

ref:

参数估计:最大似然估计MLE相关推荐

  1. 透彻理解机器学习中极大似然估计MLE的原理(附3D可视化代码)

    文章目录 相关资料 一.什么是概率,什么是似然 二.极大似然估计 Maximum Likelihood Estimation (MLE) 的含义 2.1 机器学习中的极大化似然函数 2.2 极大似然估 ...

  2. 最大似然估计MLE与贝叶斯估计

    项目github地址:bitcarmanlee easy-algorithm-interview-and-practice 欢迎大家star,留言,一起学习进步 大学期间学习数理统计这门课程的时候,没 ...

  3. 最大似然估计MLE和最大后验估计MAP理解

    1.频率学派和贝叶斯派 频率学派认为参数是固定而未知的,关心似然函数. 贝叶斯派认为参数是随机的有分布的,关心后验分布. 2.MLE.MAP公式 3.参数估计-MLE 4.参数估计-MAP MAP与M ...

  4. 简单理解极大似然估计MLE

    简单理解极大似然估计(MLE) 基本思想 使数据集中数据出现的概率(似然)最大 举例描述 假设某一个新闻文档数据集下有体育.财经.游戏等分类,已知体育类下的所有文档中"篮球"一词出 ...

  5. Python实现极大似然估计

    概念 现实中任何随机变量的概率分布函数都是未知的. 如果假定随机变量服从某种分布(如正态分布),可以通过统计手段来计算该分布的参数,这种方法称为参数估计. 极大似然估计(Maximum Likelih ...

  6. 最大似然估计,最大后验估计,贝叶斯估计联系与区别

    项目github地址:bitcarmanlee easy-algorithm-interview-and-practice 欢迎大家star,留言,一起学习进步 1.什么是参数 在机器学习中,我们经常 ...

  7. 【数学基础】参数估计之极大似然估计

    背景 先来看看几个小例子: 猎人师傅和徒弟一同去打猎,遇到一只兔子,师傅和徒弟同时放枪,兔子被击中一枪,那么是师傅打中的,还是徒弟打中的? 一个袋子中总共有黑白两种颜色100个球,其中一种颜色90个, ...

  8. 如何理解「最大似然估计」?参数估计、似然函数、最大似然估计

    文章目录 引言 参数估计 最大似然估计 似然函数 求解最大似然估计问题 为什么要对似然函数取对数? "似然"与"概率"的区别 机器学习中的应用 参考资料 引言 ...

  9. 机器学习基础——先验概率、后验概率和似然估计的讲解;频率派和贝叶斯派之分;以及MLE和MAP方法的解析

    1.先验概率 假定 B 1 , B 2 , - , B n B_1,B_2,\ldots ,B_n B1​,B2​,-,Bn​是某个过程所有可能的前提条件,也就是 B 1 , B 2 , - , B ...

最新文章

  1. 剑指Offer_12_数值的整数次方
  2. MyEclipse下安装MyBatis Generator代码反向生成工具
  3. jquery radio取值,checkbox取值,select取值,radio选中,
  4. 【JUC】第六章 Fork/Join 框架、CompletableFuture
  5. java 12_为什么在Java(高低)/ 2是错误但(高低) 1不是?
  6. 实验5.2 动态内存分配生成动态数组完成矩阵转置
  7. 基于机器视觉的Data Matrix二维码识别
  8. android触摸屏idc,android4.0触摸屏滑鼠模式解决方法-添加idc文件
  9. 原生指针auto_ptr的用法
  10. VS安装包注册com组件
  11. 2021中青杯数学建模A题 (论文+代码) 超详细
  12. 威海市第四届ACM大赛感想
  13. 中国最后的隐世美景(转)
  14. [置顶] 而立之年——三线城市程序员的年终告白
  15. 《认识突围:做复杂时代的明白人》读书笔记和自我理解感受
  16. xlive.dll缺失怎么办
  17. VS中修改解决方案/项目/类的名字
  18. wsdl和soap协议详细解析
  19. 普歌-飞灵团队-nuxt中jQuery报e.indexOf is not a function错误
  20. 一阶电路的零状态响应

热门文章

  1. 解决MAC 安装绿联网卡驱动无效问题
  2. c# 指定打开某个路径下的CMD_这招太厉害了,不用鼠标也可以打开指定文件
  3. gitbook安装使用看完这一篇就够了
  4. 从零开始的Wordpress个人网站搭建(图文)
  5. 范里安中级微观经济学(第9版)分析笔记和课后习题答案解析-完整版 范里安《微观经济学:现代观点》(第9版)笔记和课后习题详解!
  6. 云服务器数据丢失可以恢复吗?
  7. 制作一个简单的新闻客户端
  8. 你的简历能帮你争取到面试机会吗
  9. 岭南师范学院计算机考试考场,广东专插本考场安排在哪?附:2018年考场详细安排表~...
  10. 1.回文是指正读和反读均相同的字符序列,如“abba”和“abdba”均是回文,但“good”不是回文。试写一个算法判定给定的字符向量是否为回文。(提示:将一半字符入栈。)2.假设以带头结点的循环链