项目github地址:bitcarmanlee easy-algorithm-interview-and-practice
欢迎大家star,留言,一起学习进步

在各种算法相关的paper中,经常看到指数分布族这个概念。博主作为一个好奇心很强喜欢打破砂锅问到底的人,看到一个东西老在眼前晃来晃去却又似懂非懂,心里非常难受,于是想好好了解一下这个指数分布族到底是个什么鬼。。。

1.指数分布族的概念

指数分布族是指可以表示为指数形式的概率分布。wiki上的定义如下:
A single-parameter exponential family is a set of probability distributions whose probability density function (or probability mass function, for the case of a discrete distribution) can be expressed in the form
fX(x∣θ)=h(x)exp⁡(η(θ)⋅T(x)−A(θ))f_X(x\mid\theta) = h(x) \exp \left (\eta(\theta) \cdot T(x) -A(\theta)\right )fX​(x∣θ)=h(x)exp(η(θ)⋅T(x)−A(θ))

其中,η\etaη为自然参数(nature parameter),T(x)T(x)T(x)是充分统计量(sufficient statistic)。当参数A,h,T都固定以后,就定义了一个以η\etaη为参数的函数族。

2.其他常见分布于指数分布族的关系

2.1 伯努利分布

伯努利分布是对0,1分布的问题进行建模。对于Bernouli(φ),y∈{0,1}Bernouli(\varphi),y\in\{0,1\}Bernouli(φ),y∈{0,1},其概率密度函数如下:
{p(y=1;φ)=φp(y=1;φ)=φ\begin{cases} p(y=1;\varphi) = \varphi \\ p(y=1;\varphi) = \varphi \end{cases} {p(y=1;φ)=φp(y=1;φ)=φ​

将其华为指数分布族的形式:
KaTeX parse error: No such environment: align at position 7: \begin{̲a̲l̲i̲g̲n̲}̲ P(y,\varphi) &…

将上面转化以后的表达式与指数分布族对比,可以看出:
h(y)=1h(y) = 1h(y)=1 T(y)=yT(y) = yT(y)=y η=logφ1−φ\eta=log\frac{\varphi}{1-\varphi}η=log1−φφ​ φ=11+e−η\varphi=\frac{1}{1+e^{-\eta}}φ=1+e−η1​ A(η)=−log(1−φ)A(\eta)=-log(1-\varphi)A(η)=−log(1−φ)

由此可见,伯努利分布也是指数分布族的一种。细心的小伙伴发现了,θ\thetaθ的形式与logistic函数的形式一致。(logistic函数的详解请参考 http://blog.csdn.net/bitcarmanlee/article/details/51154481)。这是因为 logistic模型对问题的前置概率估计其实就是伯努利分布。(貌似没有特别理解,以后再来慢慢琢磨)

2.2高斯分布(正态分布)

关于高斯分布的来龙去脉,足足可以写厚厚一本书。后面有时间回来详细整理高斯分布的相关资料。
关于高斯分布的详细推导过程如下(为了方便起见,将方差σ\sigmaσ设为1):
KaTeX parse error: No such environment: align at position 7: \begin{̲a̲l̲i̲g̲n̲}̲ N(\mu,1) & = \…

将其与指数分布族对比,可知:
h(y)=12πexp(−12y2)h(y) = \frac{1}{\sqrt{2\pi}} exp\left(-\frac{1}{2}y^2\right)h(y)=2π​1​exp(−21​y2) T(y)=yT(y) = yT(y)=y η=μ\eta = \muη=μ A(η)=12μ2A(\eta) = \frac{1}{2}\mu ^2A(η)=21​μ2

伯努利分布与高斯分布是两个典型的指数分布族

3.广义线性模型(Generalized Linear Model GLM)

通过上面两个例子我们可以看出,在伯努利的指数分布族形式中,θ\thetaθ 与伯努利分布中的参数φ\varphiφ是一个logistic函数。而在高斯分布的指数分布族形式中,θ\thetaθ是与μ\muμ相等的一个 表达式 (前提是我们假设了σ=1\sigma=1σ=1)。通过以上的例子,θ\thetaθ以不同的映射函数与其它概率分布函数中的参数发生联系,从而得到不同的模型,广义线性模型正是将指数分布族中的所有成员(每个成员正好有一个这样的联系)都作为线性模型的扩展,通过各种非线性的连接函数将线性函数映射到其他空间,从而大大扩大了线性模型可解决的问题。

下面我们看 GLM 的形式化定义,GLM 有三个假设:

(1) y∣x;θExponentialFamily(θ)y|x;θ ExponentialFamily(\theta)y∣x;θExponentialFamily(θ) 给定样本xxx与参数θ\thetaθ,样本分类yyy 服从指数分布族中的某个分布;
(2) 给定一个xxx,我们需要的目标函数为h(θ(x))=E[T(y)∣x]h(\theta(x))=E[T(y)|x]h(θ(x))=E[T(y)∣x];
(3)η=θTx\eta=\theta^Txη=θTx。

根据伯努利分布推导logistic模型的过程如下:
KaTeX parse error: No such environment: align at position 7: \begin{̲a̲l̲i̲g̲n̲}̲ h_\theta(x) & …

总之,广义线性模型通过拟合响应变量的条件均值的一个函数(不是响应变量的条件均值),并假设响应变量服从指数分布族中的某个分布(不限于正态分布),从而极大地扩展了标准线性模型。模型参数估计的推导依据是极大似然估计,而非最小二乘法。

本博文主要参考了以下内容,感谢大牛们的无私分享:
http://www.aliog.com/83492.html

指数分布族(The Exponential Family)与广义线性回归(Generalized Linear Model GLM)相关推荐

  1. 广义线性模型(Generalized Linear Model)——机器学习

    零.前言 对于条件分布(y|x;θ),对于线性回归模型有,而对分类问题有.其实这些分布均是广义线性模型(GLM)的特殊情况. 我们通过定义广义线性模型,可以据此求出拟合函数h(x) 一.指数分布族(E ...

  2. 系统学习机器学习之线性判别式(三)--广义线性模型(Generalized Linear Models)

    转自:https://www.cnblogs.com/czdbest/p/5769326.html 在线性回归问题中,我们假设,而在分类问题中,我们假设,它们都是广义线性模型的例子,而广义线性模型就是 ...

  3. 广义线性模型(Generalized Linear Model)

    广义线性模型 1. 广义线性模型(Generalized Linear Model) 1.1 指数分布族 1.2 广义线性模型建模(三个假设) 2. 线性回归推导 2.1 Gaussian 分布的指数 ...

  4. 广义线性模型--Generalized Linear Models

    监督学习问题: 1.线性回归模型: 适用于自变量X和因变量Y为线性关系 2.广义线性模型: 对于输入空间一个区域改变会影响所有其他区域的问题,解决为:把输入空间划分成若干个区域,然后对每个区域用不同的 ...

  5. 广义线性模型(Generalized Linear Model)之二:Logistic回归

    广义线性模型(Generalized Linear Model)之二:Logistic回归 一.引入:多元线性回归模型 二.Logistic回归模型 三.非条件logistic回归模型 (一)介绍 ( ...

  6. 广义线性模型(Generalized Linear Models, GLM)与线性回归、逻辑回归的关系

    线性回归和逻辑回归都是广义线性模型的特例. 1 指数分布族 如果一个分布可以用如下公式表达,那么这个分布就属于指数分布族. 这是<数理统计>课本中的相关定义,大多数利用的定义如下(y不是一 ...

  7. 广义线性模型与指数分布族

    在机器学习领域,很多模型都是属于广义线性模型(Generalized Linear Model,GLM),如线性回归,逻辑回归,Softmax回归等.这篇文章广义线性模型,并由它推导出线性回归,逻辑回 ...

  8. 指数分布族 和 广义线性模型

    本节主要是我看了网易公开课上的Andrew Ng的机器学习公开课第四节所做的笔记加上自己的一些整理,将它发上来供参考,由于水平有限,可能有错误. 这节视频中,Andrew Ng主要讲了三个方面,分别是 ...

  9. r语言 回归分析 分类变量_R语言进阶之广义线性回归

    广义线性回归是一类常用的统计模型,在各个领域都有着广泛的应用.今天我会以逻辑回归和泊松回归为例,讲解如何在R语言中建立广义线性模型. 在R语言中我们通常使用glm()函数来构建广义线性模型,glm实际 ...

  10. 关于GLMM(generalized linear mixed model)广义线性混合模型

    文章目录 1.广义线性混合模型 2.GLMM的基本程序实现 2.1 Stata基本实现 2.2 R基本实现方法 3.GLMM的交叉项分析 3.1 Stata实现 3.2 R实现 4.置信区间的计算方法 ...

最新文章

  1. [SpringBoot之Druid]
  2. Java网络编程从0——》入门
  3. Android中的资源复用小技巧
  4. LeetCode 1685. 有序数组中差绝对值之和(前缀和)
  5. memcpy函数实现_等比例缩放c++ opencv 实现
  6. 扩展坞可以把手机投到显示器吗_解锁4K 60Hz毕亚兹USB Type-C扩展坞体验
  7. 【数据结构】栈的存储实现
  8. exchange无法收发邮件_SpringBoot2.x系列教程69--SpringBoot中整合Mail实现邮件发送
  9. 快速掌握用python写并行程序
  10. 通过Android上的意图启动Google地图路线
  11. 计算机监控防误,计算机监控防误操作系统专利_专利申请于2007-10-25_专利查询 - 天眼查...
  12. 【 Codeforces Round #301 (Div. 2) D】Bad Luck Island【概率DP】
  13. 计算机科学与技术的学士服是什么颜色的,学士服颜色分类 各色学士服都有什么讲究...
  14. 浅谈setOnClickListener使用方法
  15. 用Flash做点击页面图片切换效果的超级详细教程
  16. Ping 1000个包看丢跑率
  17. ENFI下载器:1元20G高速下载流量,首次使用送3G
  18. 基于S7-1200 PLC实现PIDNN控制仿真
  19. python pi表示_python 算pi
  20. 阿里云OCR图片识别

热门文章

  1. cdn 导致跨域问题
  2. 诺基亚成功转型:引领新一代5G技术 布局物联网
  3. iis6 服务器做301跳转返回状态码200解决方法。
  4. 转 markdown编写规则、语法
  5. (C++)String的用法
  6. Android学习---解决Android Graphical Layout 界面效果不显示
  7. 利用内存分析工具(Memory Analyzer Tool,MAT)分析java项目内存泄露
  8. ES6的开发环境搭建 1
  9. 遇见C++ Lambda
  10. JS开发工具WebStorm使用快捷键