零、前言

对于条件分布(y|x;θ),对于线性回归模型有,而对分类问题有。其实这些分布均是广义线性模型(GLM)的特殊情况。

我们通过定义广义线性模型,可以据此求出拟合函数h(x)

一、指数分布族(Exponential Family)

其定义如下

其中,η称为自然参数(natural parameter),T(y)称为充分统计量(sufficient statistic)(通常T(y)=y)。当a、b、T都确定了,就定义了以η为参数的指数分布族。

下面以伯努利分布与正态分布为例子,从指数分布族推导出它们。

1.1 Bernoulli分布

伯努利分布可写作:

对比指数分布族的定义,可知,同时也有:

注意,这时我们可以得到,即sigmoid函数的表达式,其意义后篇将说明。

1.2 Gaussian分布

实际上,σ^2的选取不影响各函数与参数的确定,这里不再证明,为了简化,我们令σ^2=1,于是有

根据指数分布族的定义,我们得到

实际上,指数分布、泊松分布、伽马分布、狄利赫里分布等很多分布也属于指数分布族,这里不再叙述。

二、GLM模型的建立

2.0 GLM的假设

对于回归或是分类问题,我们的目标是若其分布属于指数分布族的某种分布,那么根据这求出拟合函数h。具体假设如下:

1.

2.拟合函数h为条件概率期望关于特征x的函数,即

3.自然参数满足

其中假设3对η的线性假设,就是GLM中线性的由来。

2.1 普通的最小二乘

在线性回归模型中,最小二乘是最大似然,其中y|x服从高斯分布。

那么在GLM,若假设对给定x的y服从高斯分布,根据前文的证明,有μ=η,又根据线性假设η=θTx,所以μ=θTx=E(y|x)=h(x),所以得到h是线性回归

2.2 Logistic回归

对于二分问题,根据前文所述,有,根据线性假设,有φ=hθ(x),所以在二分问题中,h为logistic回归/sigmoid分布

2.3 Softmax回归

由二分问题演化,现在考虑k分问题,即y是离散的且

分类问题要对每个类别有一个判决概率φi。注意到如果对与k个分类都有对应的概率的话,会出现冗余。因为如果知道k-1个概率的话,第k个可以从其补集求出。因此,我们定义k-1个概率,,且有,那么有,因此令

我们队T(y)的定义如下

为一k-1维向量。

那么多项式分布可表示如下

所以多项式分布也属于指数分布族,且有

,那么有

所以得到,将其带入到φi中有

上式将η映射到φi,此函数称为softmax函数

又根据线性假设,对于每个η有,同时令ηk=0,对求和式没有影响,那么有

综上所述,得到的预测函数h为:

这是对于前k-1个概率,那么φk可用补集的方法求出。

最后是对softmax回归的参数最优化,对其输入m个训练样本的对数似然函数易得如下

对此最大化可用牛顿法或梯度上升法等

广义线性模型(Generalized Linear Model)——机器学习相关推荐

  1. 系统学习机器学习之线性判别式(三)--广义线性模型(Generalized Linear Models)

    转自:https://www.cnblogs.com/czdbest/p/5769326.html 在线性回归问题中,我们假设,而在分类问题中,我们假设,它们都是广义线性模型的例子,而广义线性模型就是 ...

  2. 广义线性模型--Generalized Linear Models

    监督学习问题: 1.线性回归模型: 适用于自变量X和因变量Y为线性关系 2.广义线性模型: 对于输入空间一个区域改变会影响所有其他区域的问题,解决为:把输入空间划分成若干个区域,然后对每个区域用不同的 ...

  3. 广义线性模型(Generalized Linear Model)之二:Logistic回归

    广义线性模型(Generalized Linear Model)之二:Logistic回归 一.引入:多元线性回归模型 二.Logistic回归模型 三.非条件logistic回归模型 (一)介绍 ( ...

  4. 广义线性模型(Generalized Linear Model)

    广义线性模型 1. 广义线性模型(Generalized Linear Model) 1.1 指数分布族 1.2 广义线性模型建模(三个假设) 2. 线性回归推导 2.1 Gaussian 分布的指数 ...

  5. 混合线性模型+mixed linear model+GEEs+GLMM+LMM

    混合线性模型+mixed linear model+GEEs+GLMM+LMM 线性回归 广义线性回归 混合线性模型/线性混合模型 的区别是什么? spss中遇见线性混合模型 价值,意义,目的是什么? ...

  6. R语言对数线性模型loglm函数_使用R语言进行混合线性模型(mixed linear model) 分析代码及详解...

    1.混合线性模型简介 混合线性模型,又名多层线性模型(Hierarchical linear model).它比较适合处理嵌套设计(nested)的实验和调查研究数据.此外,它还特别适合处理带有被试内 ...

  7. python 广义线性模型_数学建模/机器学习:广义加性模型(GAM)及其Python实现

    笔者做过国赛也做过美赛,其中一类典型问题就是分析相关性,从而进行预测或者其他操作.这类问题通常情况下属于比较常规的问题,一般通过matlab或SPSS分析相关性,得到一个较好的数值即可. 然而有的时候 ...

  8. 线性模型(Linear Model)

    线性模型(Linear Model) 对于给定样本x⃗ \mathbf{\vec{x}},假定其有n维特征,则,x⃗ =(x1,x2,x3,-,xn)T\mathbf{\vec{x}}=(x_1, x ...

  9. Machine Learning——Linear Model

    本系列博客是我学习周志华的<机器学习(西瓜书)>的自学笔记. 我是零基础学习,因此所写只是书上的知识,肯定不全面,以后随着学习的深入,慢慢补充吧. 基本形式 给定由ddd个属性描述的示例x ...

最新文章

  1. 使用Windows live Writer 2012发布ChinaUnix博客
  2. 框架模式 MVC 在Android中的使用
  3. 数组排序方法及C实现的总结
  4. centos7 安装配置mesos+marathon+zookeeper
  5. 【转】MySQL实现Oracle里的 rank()over(ORDER BY) 功能
  6. 查询复旦大学往年的考研成绩
  7. Java总结:正则表达式进行校验
  8. Java Web-网页基础-HTML-CSS
  9. Teamcenter开发问题之-- relation 无法创建 and 无法check in
  10. 高速公路、铁路交通的常识
  11. http://jingyan.baidu.com/article/fcb5aff78e6a48edab4a7146.html
  12. linux 3.2.0 卸载,linux python3编译以及 卸载,python默认为python3 ,pip默认为pip3,亲测版...
  13. 短视频标题自动生成工具,助你打造爆款标题
  14. 提供一个文档下载接口,用httpclient下载文件
  15. 实现音乐播放器歌词显示效果
  16. 网络私有云存储的几点优势
  17. ubuntu下好用的录屏软件之Vokoscreen
  18. 储存器的区别之——RAM、ROM、FLASH
  19. C语言:int型数据向char型数据的强制类型转换原理
  20. python槽格式里填啥_python 文件读与写详解

热门文章

  1. 沐渥科技阐述传感器的种类和作用
  2. python实现十进制转换成十六以内任意进制
  3. 5G/NR 网络切片之AMF选择(协议版)
  4. 西瓜中视频计划是如何赚钱的?教你提高视频收益的3个方法
  5. 欧元汇率java测试题_目前,多数国家(包括我国人民币)采用的汇率标价法是( )。_学小易找答案...
  6. PAT甲级1007 Maximum Subsequence Sum (25 分)题解
  7. python 实现算术均值滤波,几何均值滤波,谐波均值滤波,逆谐波均值滤波
  8. Excel 从多个文件提取指定的多行(固定行)进行汇总的工具
  9. 如何制作一个横版格斗过关游戏(2) Cocos2d-x 2.0.4
  10. Android:长度单位详解(px、dp、sp)