1、最大似然估计数学定义:

  假设总体分布为f(x,θ),X1,X2...Xn为总体采样得到的样本。其中X1,X2...Xn独立同分布,可求得样本的联合概率密度函数为:

  

  其中θ是需要求得的未知量,xi是样本值。

  此时,L(x,θ)是关于θ的函数,称之为似然函数。

  求参数θ值使得似然函数值取最大值,这种方法称之为最大似然估计。》》MLE

2、如何求解最大似然估计

  其中x是已知的,θ是需要求的变量值。如果最大似然函数可导,可以通过对θ求导的方式,取得L(x,θ)的极值。

  在实际中为了方便计算,往往先对L(x,θ)取对数:

    加入求导:

3、使用MLE推导逻辑回归

  逻辑回归中使用sigmoid函数,将输出值确定在范围0到1之间。此时输出的值相当于概率中某一个样本的值。即上述所讲的X1,X2...Xn。

而sigmoid函数中所需要求的w,即为似然函数中的θ。

  有如下公式:

    1、sigmoid函数

      此时没有截距b,加入后在归一化时会被约掉,所以干脆不使用b。

    2、sigmoid求导

         3、对数似然函数    

      概率分布为:

      将上面两式子写作联合:

      联合概率密度函数为:

      

      构建似然函数:

  4、求解MLE

  5、与UFLDL中的RL结合,改变某些表述:

    概率分布:    

    似然函数:

    

    求解MLE:

    矩阵形式:

得到似然函数对θ的导数后,使用梯度下降法来更新θ,使得最终的结果接近于label。

4、使用似然估计推导softma

  (此处使用UFLDL中的公式,敲公式好麻烦。。。)

  (1)概率

  (2)似然函数

  (3)对似然函数关于θq求导

      似然函数展开:

      求导:

最后,同样使用梯度下降法来求最优θ。

LR可以使用最大熵来推导,在后续给出。

参考:

UFLDL

有机会,会做一个UFLDL的总结博客。

转载于:https://www.cnblogs.com/wangxiu/p/5667731.html

ML 徒手系列 最大似然估计相关推荐

  1. 【声源定位】 球面散乱数据插值方法/似然估计hybrid spherical interpolation/maximum likelihood (SI/ML) 麦克风阵列声源定位

    1.软件版本 MATLAB2021a 2.本算法理论知识点 球面散乱数据插值方法/似然估计SI/ML 麦克风阵列声源定位 3.算法具体理论 这个部分的程序如下所示: 这个部分理论如下所示: 本文最后的 ...

  2. 基于接收信号强度(RSS)的室内定位/无线传感器网络定位——极大似然估计ML/最小二乘估计WLS

    基于接收信号强度(RSS)的室内定位/无线传感器网络定位--极大似然估计ML/最小二乘估计WLS 原创不易,路过的各位大佬请点个赞 针对AOA,TOA,TDOA,RSS等室内定位.导航的探讨.技术支持 ...

  3. 基于到达时间(TOA)的室内定位(/无线传感器网络定位)——极大似然估计ML

    基于到达时间(TOA)的室内定位(/无线传感器网络定位)--极大似然估计ML 原创不易,路过的各位大佬请点个赞 针对AOA,TOA,TDOA,RSS等室内定位.导航的探讨.技术支持.==代码(有偿)= ...

  4. MATLAB之线性回归,逻辑回归,最小二乘法,梯度下降,贝叶斯,最大似然估计

    文章目录 线性回归(定义域(-∞,+∞),值域(-∞,+∞),即输入输出连续) 线性回归/最小平方误差理论 MATLAB之线性回归/最小平方误差 损失函数/代价函数求导法求线性回归 一次拟合求线性系统 ...

  5. 深度模型从研者 眼里的 似然估计 Hessain 海森矩阵 Fisher Information (费雪信息)...

    2019独角兽企业重金招聘Python工程师标准>>> 深度模型的训练的基本依据是最小化模型拟合数据的误差.旨在不仅知其然(如何构建和训练一个深度模型),还应知其所以然(为什么这样训 ...

  6. 一个例子搞清楚(先验分布/后验分布/似然估计)

    一个例子搞清楚(先验分布/后验分布/似然估计) preface: 无论是<通信原理>.<信息论>.<信道编码>还是<概率与统计理论>,或者在现在流行的& ...

  7. 参数估计:最大似然估计MLE

    http://blog.csdn.net/pipisorry/article/details/51461997 最大似然估计MLE 顾名思义,当然是要找到一个参数,使得L最大,为什么要使得它最大呢,因 ...

  8. 最大似然估计,最大后验估计,贝叶斯估计联系与区别

    项目github地址:bitcarmanlee easy-algorithm-interview-and-practice 欢迎大家star,留言,一起学习进步 1.什么是参数 在机器学习中,我们经常 ...

  9. 机器学习基础(五)最大似然估计

    最大似然估计 我们希望有些准则可以让我们从不同模型中得到特定函数作为好的估计,而不是猜测某些函数可能是好的估计,然后分析其偏差和方差.最常用的准则是最大似然估计. 接下来是较为枯燥的数学推导,耐心看下 ...

最新文章

  1. RRC Connection Reconfiguration
  2. 如何进行大数据分析及处理?
  3. [unreal4入门系列之十五] UE4中的动态数组:TArray容器
  4. 60度斜坡怎么计算_【测绘】南方CASS土方计算方法—方格网法
  5. c#程序中使用quot;like“查询access数据库查询为空的问题
  6. iOS之加密的三种方法
  7. Lucene3.5自学4--建索引相关知识总结
  8. dlut-KFQ人工智能导论答案1
  9. 求集合的所有子集问题
  10. 超实用!SKETCH大师最常用的3个实战小技巧
  11. 制作一个企业网站——html华为官网购物商城项目的设计与实现
  12. cmd命令查询电脑序列号_如何查看台式电脑序列号
  13. 终于搞懂了回车与换行的区别
  14. 划片机的性能决定了芯片产品的质量
  15. c#中控制不能从一个case标签贯穿到另一个case标签是啥意思
  16. Linux 内核协议栈的 TSO、GSO
  17. 【NDN基础】Information-Centric Networking: A Natural Design for Social Network Applications 全文翻译
  18. 在zotero中利用better bibtex产生google scholar相同的citation key
  19. php保留小数点4位,PHP小数点后保留几位的教程实例
  20. echarts 多组图例重叠问题

热门文章

  1. Eclipse中使用git前账号密码等的配置问题
  2. 手把手教你使用TF服务将TensorFlow模型部署到生产环境
  3. zanePerfor 一款完整,高性能,高可用的前端性能监控系统,不要错过
  4. 考试题string——线段树。
  5. 30种优化查询速度的方法
  6. oschina的博客还让不让人用了?发的文章竟然不见了!!
  7. BZOJ2888 : 资源运输
  8. 如何使用窗体开发-理解那些函数怎么来的?
  9. 一个简单的Spring的AOP例子(JAVA面向切面编程)
  10. 《JavaScript入门经典》学习笔记1