softmax函数在机器学习中是常用的多分类器,特别是在卷积神经网络中,最后的一层经常都是使用softmax分类器进行多类别分类任务。虽然softmax看上去相对比较简单,但是其实其中蕴含的数学推导还是比较复杂的,特别是对于数学不太好的同学。这篇文章主要就是结合自己学习《神经网络与深度学习》的一些笔记和体会。其中很多公式部分参考了《神经网络与深度学习》,如有不恰当的地方,欢迎批评指正。
softmax函数是logistic函数的一般形式,是将分类问题转化为概率问题,其实说白了,就是求解统计所有可能的概率,然后概率最大的即认为为该类别。首先直接建立多类线性分类器。假设 y = {1, · · · , C}共 C 个类别,首先定义C个判别函数。
这里Wc 为类 c的权重向量。
    这样,对于空间中的一个点x,如果存在类别c,对于所有的其他类别c ˜(wT c x ̸= c) 都满足fc(x) > fc ˜(x),那么x属于类别 c。相应的分类函数可以表示为: 
  
    当 C = 2 时,就是Logistics二类分类器,
 
  SoftMax回归是Logistic回归的多类推广。
  多类线性分类函数的参数 w有很多种优化算法。这里我们介绍一种常用的学习算法: SoftMax 回归。在SoftMax回归中,机器学习模型预测目标为每一个类别的后验概率。这就需要用到softmax函数。
  利用 softmax函数,我们定义目标类别 y = c的后验概率为:
                                                         
   对于样本(x, y),输出目标 y = {1, · · · , C},我们用 C 维的one-hot向量 y来表示输出目标。对于类别 c, 
  这里, I()是指示函数。 
  同时,我们将公式3.59重新定义一下,直接输出 k 维向量
                                                                        
  其中, W = [w1, · · · , wC]是 C 个类对应权重向量组成的矩阵。 y ˆ 的第 c维的值是第 c类的预测后验概率。其中, z ˆ = W Tx,为 softmax函数的输入向量。
  给定 N 给样本(x(i), y(i)), 1 ≤ i ≤ N,我们使用交叉熵损失函数,模型在训练集的风险函数为:
  采样梯度下降法,我们要计算 J (W)关于 W 的梯度。首先,我们列下要用到的公式。
1. softmax函数的导数为 
  


    下面讲述的是关于softmax的导数求法,对于 K 个标量 x1, · · · , xK, softmax函数定义为
    这样,我们可以将 K 个变量 x1, · · · , xK 转换为一个分布: z1, · · · , zK,满足
   当 softmax函数的输入为 K 维向量 x时 
                                                        
   其中, 1¯K = [1, · · · , 1]K×1 是 K 维的全1向量 
 

softmax分类器推导相关推荐

  1. 3.9 训练一个 Softmax 分类器-深度学习第二课《改善深层神经网络》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 3.8 Softmax 回归 回到目录 3.10 深度学习框架 训练一个 Softmax 分类器 (Training a Softmax Classifier) 上一个视频中 ...

  2. 训练softmax分类器实例_CS224N NLP with Deep Learning(四):Window分类器与神经网络

    Softmax分类器 我们来回顾一下机器学习中的分类问题.首先定义一些符号,假设我们有训练集 ,其中 为输入, 为标签,共包括 个样本: 表示第 个样本,是一个 维的向量: 表示第 个样本的标签,它的 ...

  3. 深度学习系列--1.入坑模型: 线性回归,logistic 回归,softmax分类器

    惭愧啊,读研的时候学得正是模式识别:当看着书本上都是公式推导.博士师兄们也都在公式推导研究新算法的时候,排斥心理到了顶点,从此弃疗. 工作三年,重新捡起,因为更关注实际操作,所以选择了<pyth ...

  4. 训练softmax分类器实例_吴恩达深度学习笔记(56)-训练一个 Softmax 分类器

    训练一个 Softmax 分类器(Training a Softmax classifier) 上一个笔记中我们学习了Softmax层和Softmax激活函数,在这个笔记中,你将更深入地了解Softm ...

  5. Logistic 分类器与 softmax分类器

    Logistic 分类器与 softmax分类器 首先说明啊:logistic分类器是以Bernoulli(伯努利) 分布为模型建模的,它可以用来分两种类别:而softmax分类器以多项式分布(Mul ...

  6. softmax函数计算概念,过程。Coursera | Andrew Ng (02-week3-3.9)—训练一个 Softmax 分类器

    版权声明:本文为博主--ZJ--原创文章,未经博主允许不得转载. https://blog.csdn.net/JUNJUN_ZHAO/article/details/79122927 该系列仅在原课程 ...

  7. SVM与SoftMax分类器

    出处:http://blog.csdn.net/han_xiaoyang/article/details/49999299  声明:版权所有,转载请注明出处,谢谢. 转给自己 1. 线性分类器 在深度 ...

  8. 深度学习与计算机视觉(二)线性SVM与Softmax分类器

    2.线性SVM与Softmax分类器 2.1 得分函数(score function) 2.1.1 线性分类器 2.1.2 理解线性分类器 2.2 损失函数 2.2.1 多类别支持向量机损失(Mult ...

  9. 深度学习与计算机视觉系列(3)_线性SVM与SoftMax分类器--在深度学习的视觉分类中的,这两个分类器的原理和比较

    作者: 寒小阳  时间:2015年11月.  出处:http://blog.csdn.net/han_xiaoyang/article/details/49999299  声明:版权所有,转载请注明出 ...

最新文章

  1. 世界杯开幕硅谷也疯狂:员工边看踢球边工作
  2. 【商业落地篇】Gartner第四范式全球首发AutoML系列白皮书(限时免费下载)
  3. 常用的搜索引擎dork (不断更新)
  4. linux 浏览器 links,linux下的命令行浏览器links
  5. 【转】近期Coolite控件的技术点总结
  6. 父组件给子组件传值方法_【Vue】小学生都能看懂的子父组件传值
  7. PPT模板(淘宝花钱买来的,免费分享给大家)
  8. iPhone 5用户们,苹果又喊你更新了,不然可能会变砖!
  9. 大数据之-Hadoop之HDFS_HDFS的优缺点---大数据之hadoop工作笔记0049
  10. mariadb multi-source replication(mariadb多主复制)
  11. MFC中CDC画线总结
  12. 微信小游戏《头脑吃鸡》题库
  13. linux麒麟镜像,银河麒麟、优麒麟的软件源和镜像站
  14. 视差贴图(Parallax Mapping)
  15. MySQL 系统表空间ibdata:我也不想当一个死肥宅
  16. 高德h5地图api接口_H5,JS中使用微信、高德获取定位
  17. tensorflow查看pb文件
  18. 【I2C时序分析】-hym8563为列
  19. 遭遇PSW Win32 WoWar Trojan Win32 MnLess Trojan IMMSG Win32 TBM
  20. subtext3插件安装

热门文章

  1. JanusGraph服务器
  2. android视频图片上传,适配Android WebView支持上传图片,视频
  3. Linux串口输出启动信息,linux开发板启动过程串口打印信息
  4. 关于Application.DoEvents()
  5. html语音聊天室,h5聊天室模板|仿微信聊天室html5
  6. 2022-2027年中国合成纤维行业市场全景评估及发展战略规划报告
  7. 英文经典好歌《Nothing's Gonna Change My Love For You》没有什么能够改变我对你的爱-英译中
  8. laravel rbac权限管理系统
  9. 【顶】辞职也需要辞得帅,辞得大家都开心,多为将来考虑,辞职不要急,本是好事要办好
  10. 【学习笔记】Git企业级使用—完整流程