最大似然估计 高斯分布
极大似然估计法是求估计的另一种方法。它最早由高斯提出。后来为费歇在1912年的文章中重新提出,并且证明了这个方法的一些性质。极大似然估计这一名称也是费歇给的。这是一种上前仍然得到广泛应用的方法。它是建立在极大似然原理的基础上的一个统计方法,极大似然原理的直观想法是:一个随机试验如有若干个可能的结果A,B,C,…。若在一次试验中,结果A出现,则一般认为试验条件对A出现有利,也即A出现的概率很大。
最大似然估计法的基本思想
最大似然估计法的思想很简单:在已经得到试验结果的情况下,我们应该寻找使这个结果出现的可能性最大的那个 作为真 的估计。
我们分两种情进行分析:
1.离散型总体
设 为离散型随机变量,其概率分布的形式为 ,则样本 的概率分布为 ,在 固定时,上式表示 取值 的概率;当 固定时,它是 的函数,我们把它记为 并称为似然函数。似然函数 的值的大小意味着该样本值出现的可能性的大小。既然已经得到了样本值 ,那它出现的可能性应该是大的,即似然函数的值应该是大的。因而我们选择使 达到最大值的那个 作为真 的估计。
2.连续型总体
设 为连续型随机变量,其概率密度函数为 则 为从该总体抽出的样本。因为相互独立且同分布,于是,样本的联合概率密度函数为
,在 是固定时,它是在 处的 密度,它的大小与 落在附近的概率的大小成正比,而当样本值 固定时,它是 的函数。我们仍把它记为并称为似然函数。类似于刚才的讨论,我们选择使 最大的那个 作为真 的估计。
总之,在有了试验结果即样本值 时,似然函数 反映了 的各个不同值导出这个结果的可能性的大小。我们选择使 达到最大值的那个 作为真 的估计。这种求点估计的方法就叫作最大似然法。
7.2.2 最大似然估计的求法
假定现在我们已经观测到一组样本 要去估计未知参数 。一种直观的想法是,哪一组能数值使现在的样本出现的可能性最大,哪一组参数可能就是真正的参数,我们就要用它作为参数的估计值。这里,假定我们有一组样本 .如果对参数的两组不同的值 和,似然函数有如下关系
,
那么,从 又是概率密度函数的角度来看,上式的意义就是参数 使出现的可能性比参数 使 出现的可能性大,当然参数 比更像是真正的参数.这样的分析就导致了参数估计的一种方法,即用使似然函数达到最大值的点,作为未知参数的估计,这就是所谓的最大似然估计。现在我们讨论求最大似然估计的具体方法.为简单起见,以下记 ,求θ的极大似然估计就归结为求 的最大值点.由于对数函数是单调增函数,所以
(7.2.1)
与 有相同的最大值点。而在许多情况下,求 的最大值点比较简单,于是,我们就将求 的最大值点改为求 的最大值点.对 关于 求导数,并命其等于零,得到方程组
, (7.2.2)
称为似然方程组。解这个方程组,又能验证它是一个极大值点,则它必是 ,也就是 的最大值点,即为所求的最大似然估计。大多常用的重要例子多属于这种情况。然而在一些情况下,问题比较复杂,似然方程组的解可能不唯一,这时就需要进一步判定哪一个是最大值点。
还需要指出,若函数 关于 的导数不存在时,我们就无法得到似然方程组(7.2.2),这时就必须根据最大似然估计的定义直接去 的最大值点。
在一些情况下,我们需要估计 。如果 分别是 的最大似然估计,则称 为 的最大似然估计。
下面我们举一些例子来说明求最大似然估计的方法。
例 7.2.1 设从正态总体 抽出样本 ,这里未知参数为mm 和 (注意我们把 看作一个参数)。似然函数为
=
它的对数为
,
似然方程组为
由第一式解得
, (7.2.3)
代入第二式得
. (7.2.4)
似然方程组有唯一解( , ),而且它一定是最大值点,这是因为当 或 或∞时,非负函数 。于是 和 的最大似然估计为
, . (7.2.5)
这里,我们用大写字母表示所有涉及的样本,因为最大似然估计 和 都是统计量,离开了具体的一次试验或观测,它们都是随机的。
例7.2.2 设总体 服从参数为的泊松分布,它的分布律为
,
有了样本 之后,参数λ的似然函数为
,
似然方程为
,
解得
.
因为 的二阶导数总是负值,可见,似然函数在 处达到最大值。所以, 是λ的最大似然估计。
例7.2.3设总体 为 上的均匀分布,求 的最大似然估计。
的概率密度函数为
对样本 ,
很显然,L(a,b)作为a和b的二元函数是不连续的。这时我们不能用似然方程组(7.2.2)来求最大似然估计,而必须从最大似然估计的定义出发,求L(a,b)的最大值。为使L(a,b)达到最大,b-a应该尽量地小,但b又不能小于 ,否则,L(a,b)=0。
类似地,a不能大过 。因此,a和b的最大似然估计为
,
.
现在为止,我们以正态分布,泊松分布,均匀分布的参数以及事件发生的概率的估计为例子讨论了矩估计和最大似然估计。在我们所举的例子中,除了均匀分布外,两种估计都是一致的。矩估计的优点是简单,只需知道总体的矩,总体的分布形式不必知道。而最大似然估计则必须知道总体分布形式,并且在一般情况下,似然方程组的求解较复杂,往往需要在计算机上通过迭代运算才能计算出其近似解。
本文出处:http://bbs.sciencenet.cn/home.php?mod=space&uid=491809&do=blog&id=400893
最大似然估计 高斯分布相关推荐
- 二维正态分布的最大似然估计_最大似然估计-高斯分布
前言:介绍了最简单的 问题 (这里都是玩具数据,为了方便理解才列出) 0123456789101112 X 1 2 3 4 4.2 4.4 4.6 4.8 5 6 7 8 y 0 0 0 0 1 1 ...
- 回归算法 - 线性回归求解 θ(最大似然估计求解)
回顾线性回归的公式:θ是系数,X是特征,h(x) 是预测值. h(x) = θ0 + θ1x1 + θ2x2 + - + θnxn h(x) = Σ θixi( i=0~n ) h(x) = θTX ...
- 深度学习中的最大似然估计简介
统计领域为我们提供了很多工具来实现机器学习目标,不仅可以解决训练集上的任务,还可以泛化.例如参数估计.偏差和方差,对于正式地刻画泛化.欠拟合和过拟合都非常有帮助. 点估计:点估计试图为一些感兴趣的量提 ...
- 【机器学习基本理论】详解最大似然估计(MLE)、最大后验概率估计(MAP),以及贝叶斯公式的理解
[机器学习基本理论]详解最大似然估计(MLE).最大后验概率估计(MAP),以及贝叶斯公式的理解 https://mp.weixin.qq.com/s/6H0gmMWvTExySMraroLVlQ 最 ...
- 详解最大似然估计(MLE)、最大后验概率估计(MAP),以及贝叶斯公式的理解...
转载声明:本文为转载文章,发表于nebulaf91的csdn博客.欢迎转载,但请务必保留本信息,注明文章出处. 原文作者: nebulaf91 原文原始地址:http://blog.csdn.net ...
- 最大似然估计(MLE:样本观测总体参数)是如何工作的?
1. MLE的意义:样本估计总体分布参数 假定一个事件的观测样本服从如下分布,我们如何确定总体数据的分布模型? 首先应该想到是建立线性回归模型,然而由于该变量不是正态分布的,而且是不对称的,因此不符合 ...
- 最小二乘与最大似然估计之间的关系
最小二乘与最大似然估计之间的关系 1.结论 测量误差(测量)服从高斯分布的情况下, 最小二乘法等价于极大似然估计. 2.最大似然估计概念 最大似然估计就是通过求解最大的(1)式得到可能性最 ...
- 最大似然估计和最大后验概率估计的理解与求解
1. 最大似然估计的理解 最大似然估计(Maximum likelihood estimation, 简称MLE)和最大后验概率估计(Maximum a posteriori estimation, ...
- 最大似然估计_状态估计的基本概念(2)最大似然估计和最大后验估计
(1)最大似然估计ML和最大后验估计MAP 最大似然估计量 非贝叶斯方法通常是最大化似然函数: 其中 被称为 的最大似然估计量,它是 的函数. 最大后验估计量 估计随机参数的通常方法是最大化后验分布函 ...
最新文章
- as3中TextFormat类的使用
- Git 这样回退代码,才足够优雅
- 基于python的界面自动化测试-基于python的接口自动化测试+ddt数据驱动
- 天津:第十六届西青区民俗文化旅游节开幕
- 【桌面虚拟化】之五PCoIP
- 使用字符代替圆角尖角研究(转)
- linux安装包安装mysql5.7
- const char *p,char const *p, char * const p之间的区别
- 【华为云技术分享】一文带你了解Web前端发展历程
- mac weka连接mysql_weka连接mysqllinux
- mysql 添加添加事务处理
- Inno Setup 简体中文语言包
- C语言求解鸡兔同笼问题
- Unity发布游戏在iOS设备上出现的字体问题
- 树莓派是什么 树莓派能做什么 树莓派的功能用途
- selenum登录163邮箱
- Rancher管理k8s集群
- Python 读取excel指定的列
- Python判断素数(质数)——循换结构、控制及else循环扩展模式的实践
- css3 火焰文字,Css3字体做出火焰效果的实现步骤
热门文章
- human-robotic eco system
- PEEL!!!!!!!! it is the easiest way for English arguments
- 想要早睡的最好的办法就是
- windows 如何使用4GB(开启3GB和PAE)
- LeetCode 669. Trim a Binary Search Tree修剪二叉搜索树 (C++)
- 消息队列系列二(IOT中消息队列的应用)
- Redis过期策略及实现原理
- Shell 环境中的预定义变量
- WebGIS--ArcGIS系列开发五:SDE for Oracle
- python-------装饰器