Logistic Regression具备算法复杂度低,容易实现等特点,常用于二分类问题。但是在多分类问题中,就显得力不从心了。Softmax Regression 实际是Logistic Regression算法在多分类问题上的推广。其核心在于任意两个类直接是线性可分的。

1. Softmax Regression 模型

假设有m个训练样本和k个类别标签,描述如下:

利用θ表示学习模型的参数,对于每一个样本,估计其所属的类别概率为:

2. Softmax Regression损失函数与求解

类似于logistic regression回归损失函数设计,softmax regression损失函数如下所示:

对于上面的损失函数,可以采用梯度下降算法进行求解。首先计算损失函数的梯度:

所以,参数θ的更新公式为:

3. Softmax regression和Logistic regression的关系

Softmax regression回归器中存在FxK个待学习的参量。其中,F指特征分量的个数;K指所属的类别数目。实际应用中,FxK未知参数矩阵存在参数冗杂的问题。证明如下:

通过上面分析,我们可以发现,从未知参量矩阵中减去向量,模型的预测结果并没有发生改变。因此,softmax regression参数矩阵中存在冗余参数。

下面利用Soft regression推导Logistic regression.当k=2时,softmax regression算法的假设函数为:

利用softmax regression参数冗杂的特点,令△=θ1,从两个向量中都减去这个向量:

通过上式,我们可以发现,LR就是SR的一种特例。

[原理篇] Soft Regression相关推荐

  1. Faster RCNN原理篇(一)——Bounding-Box Regression边界框回归的学习和理解

    Bounding-Box Regression边界框回归的学习和理解 引言 1. (Why?)为何要做边框回归? 2. (What?)什么是边框回归? 3. (How?)如何实现边框回归? 4. 边框 ...

  2. 《CDN 之我见》系列二:原理篇(缓存、安全)

    2019独角兽企业重金招聘Python工程师标准>>> <CDN之我见>共由三个篇章组成,分为原理篇.详解篇和陨坑篇.本篇章适合那些从未接触过.或仅了解一些 CDN 专业 ...

  3. 检查压缩包是否损坏_修复损坏的gzip压缩文件之原理篇

    接修复损坏的gzip压缩文件之原理篇,再次引用GZIP结构图: 已知修复一个损坏的gzip文件的关键环节在于找到下一个正常压缩包的起始点.根据结构图中的信息可知,每个压缩包的开始结构中有是否到达尾部标 ...

  4. Tomcat 原理篇

    TOMCAT 原理篇 一.Tomcat 组成(Tomcat 由以下组件组成) 1.server a) Server是一个Catalina Servlet容器: b) Server 可以包含一个或多个s ...

  5. React Native JSBundle拆包之原理篇

    概述 RN作为一款非常优秀的移动端跨平台开发框架,在近几年得到众多开发者的认可.纵观现在接入RN的大厂,如qq音乐.菜鸟.去哪儿,无疑不是将RN作为重点技术栈进行研发. 不过,熟悉RN的开发者也知道, ...

  6. 通过“四大行为”对WCF的扩展[原理篇]

    整个WCF框架由两个基本的层次构成,即服务模型层和信道层.对信道层的扩展主要通过针对绑定的扩展实现,具体来说就是自定义绑定元素,以及相关的信道管理器(信道监听器和信道工厂).信道来改变对消息的处理和传 ...

  7. 《CDN 之我见》原理篇——CDN的由来与调度

    2019独角兽企业重金招聘Python工程师标准>>> CDN是将源站内容分发至全国所有的节点,从而缩短用户查看对象的延迟,提高用户访问网站的响应速度与网站的可用性的技术.它能够有效 ...

  8. 原理篇 | 推荐系统之矩阵分解模型

    导语:本系列文章一共有三篇,分别是 <科普篇 | 推荐系统之矩阵分解模型> <原理篇 | 推荐系统之矩阵分解模型> <实践篇 | 推荐系统之矩阵分解模型> 第一篇用 ...

  9. Kubernetes应用部署模型解析(原理篇)

    2019独角兽企业重金招聘Python工程师标准>>> Kubernetes应用部署模型解析(原理篇) 博客分类: Kubernetes [编者按]Kubernetes可用来管理Li ...

最新文章

  1. 设置***遇到一个小问题
  2. 继承的综合运用《Point类派生出Circle类而且进行各种操作》
  3. 安川交流伺服电机的驱动
  4. 用java分组查elasticsearch
  5. ad18原理图器件批量修改_Altium Designer 15原理图设计基础
  6. 又一大厂裁员!当天粗暴通知、赔偿N+1但没年终奖?小红书回应了...
  7. [Java] 蓝桥杯ADV-65 算法提高 格子位置
  8. 1+2+3+...+100 不允许使用乘法和除法,条件分支循环等
  9. 学习笔记 再论静态方法和类方法
  10. JAVA代码 httpclient 模拟NTLM域登录 GET、POST两种连接方式
  11. 西门子1212c 通过高速脉冲输出控制台达B2伺服电机
  12. win11没有扫雷了?咱用python做一个(效果演示+源码分享)
  13. 基于arduino的ESP32 学习笔记(四)基于AIDA64的电脑性能监控
  14. [Photography] 还是DPP好!
  15. STM32CubeMX配置读取MLX90614(GY-906)非接触红外测温传感器
  16. Encoded Strings I 模拟(2021.11.沈阳)
  17. 警告:关于电磁辐射对孕妇的危害。
  18. 计量经济学学习笔记:多重共线性、异方差、自相关
  19. 央妈是怎么印钱的(1)--资产负债表
  20. 基于微信小程序投票评选系统设计与实现开题答辩PPT

热门文章

  1. HBase API 详细例子(封装的DAO类)
  2. HeartBeat Install
  3. 微软MVP社区夏日巡讲诚邀您的参与: 北京,上海,西宁,成都,西安
  4. [导入]ASP.NET AJAX 说明文档-客户端引用-全局命名空间-JavaScript 基础类型扩展-Array 类型扩展-contains 函数...
  5. CodeForce 237C Primes on Interval(二分+ 素数筛法)
  6. RNN和LSTM、GRU的简单理解
  7. LinuxMint(Ubuntu)安装文泉驿家族黑体字
  8. 文件夹获取管理员权限脚本
  9. Spark跟Flink的常见问题
  10. 【Codeforces717F】Heroes of Making Magic III 线段树 + 找规律