理论知识

softmax函数如下:

一个样本在C个类别的评分为z,可以看出z为一个向量。softmax函数对

进行压缩,输出一个向量,其中每个元素值在0到1之间,且所有元素之和为1。

交叉熵定义如下:

为真实的分布,
为估计分布。

将softmax函数与交叉熵相结合,就可以得到如下式子:

另一种等价的形式为:

信息理论的角度来理解:

相对熵也被称为KL散度,它用于衡量同一个随机变量X的两个分布p(X)和q(X)之间的差异,p(X)表示样本的真实分布,q(X)表示预测的分布,DL散度的公式如下:

相对熵的特点是只有只有p(x)=q(x)时,其值才为0,若p(x)和q(x)略有差异,其值就会大于0。

整理之后可以得到:

称为熵,而
则是交叉熵。

由于真实概率分布是固定的(虽然我们现在不知道,但我们有训练集),但是它的概率质量都分布在正确的类别上(

,即在
的位置有一个单独的1),所以H(p(x))为常数,那么就可以等价地把交叉熵损失函数看做对两个分布之间的相对熵做最小化操作,那么相对熵达到最小值的时候,也意味着交叉熵达到了最小值。对
的优化就等效于求交叉熵的最小值。
则是softmax函数。

概率论解释:

可以解释为是给定图像数据

,以
为参数,分配给正确分类标签
的归一化概率。在没有使用softmax之前的评分值则解释为没有归一化的

对数概率

现在我们想做的是找到使正确类别的概率最大的W,这正好是极大似然估计(MLE)的作用,即:

对其取负对数:

让似然函数的负对数最小就等价于似然函数最大,这和交叉熵的公式完全一样!

算法实现部分重点的就是求梯度和向量化了,这部分之后再统一写吧,之后的内容和SVM没什么差别,softmax分类器也是个模板匹配。

训练softmax分类器实例_assignment1-softmax分类器相关推荐

  1. 训练softmax分类器实例_第四章.模型训练

    迄今为止,我们只是把机器学习模型及其大多数训练算法视为黑盒.但是如果你做了前面几章的一些练习,你可能会惊讶于你可以在不知道任何关于背后原理的情况下完成很多工作:优化一个回归系统,改进一个数字图像分类器 ...

  2. 训练softmax分类器实例_吴恩达深度学习笔记(56)-训练一个 Softmax 分类器

    训练一个 Softmax 分类器(Training a Softmax classifier) 上一个笔记中我们学习了Softmax层和Softmax激活函数,在这个笔记中,你将更深入地了解Softm ...

  3. 把树分成森林 matlab,20170106RF_Matlab 随机森林指的是利用多棵树对样本进行训练并预测的一种分类器,包括两个方面:数据的随 269万源代码下载- www.pudn.com...

    文件名称: 20170106RF_Matlab下载  收藏√  [ 5  4  3  2  1 ] 开发工具: matlab 文件大小: 441 KB 上传时间: 2017-01-06 下载次数: 0 ...

  4. 利用训练数据建立一个简单的分类器

    利用训练数据建立一个简单的分类器 在机器学习领域中,分类指的是利用数据的特性将其分成若干类型的过程.分类器则可以是实现分类功能的任意算法,最简单的分类器就是简单的数字函数.在真实世界中,分类器可以是非 ...

  5. 速度超Mask RCNN四倍,仅在单个GPU训练的实时实例分割算法

    这个带分割是25帧,有漏检. 速度超Mask RCNN四倍,仅在单个GPU训练的实时实例分割算法 原文:速度超Mask RCNN四倍,仅在单个GPU训练的实时实例分割算法 | 技术头条 https:/ ...

  6. 《推荐系统笔记(三)》Adaboost算法 —— 弱分类器组合成强分类器的方法

    前言 我们将介绍将弱分类器组合成强分类器的算法,Adaboost算法,以及该算法有效的证明. 对于这种提升方法,我们有 每次迭代加大误分类点的权重,这样下次生成的弱分类器能够更可能将该误分类点分类正确 ...

  7. 二类分类器构造多类分类器

    from: http://tech.ddvip.com/2009-03/1238054080112304.html 从 SVM的那几张图可以看出来,SVM是一种典型的两类分类器,即它只回答属于正类还是 ...

  8. haar级联分类器车辆检测_Haar级联分类器Open CV用于人脸检测的术语

    haar级联分类器车辆检测 Haar级联分类器概述(An overview of Haar cascade classifier) Haar cascade classifier is an open ...

  9. KLD Loss( tf.nn.softmax, torch.nn.functional.softmax, log_softmax, kl_div) 计算技巧(一)

    最近在比较不同模型的性能,发现虽然文献中使用的相同的指标,比如KLD.但是数据的处理方式却存在着差异,这会导致最后的数据并不具有直接可比性. 这里记录下,其中的一些值得记住的细节.主要涉及的API包括 ...

  10. 训练softmax分类器实例_知识蒸馏:如何用一个神经网络训练另一个神经网络

    作者:Tivadar Danka 编译:ronghuaiyang 原文链接 知识蒸馏:如何用一个神经网络训练另一个神经网络​mp.weixin.qq.com 导读 知识蒸馏的简单介绍,让大家了解知识蒸 ...

最新文章

  1. Linux程序前台后台切换
  2. Asp.Net 之 通过调用 WScript.Shell 启动本地 exe 程序时产生“ automation服务器不能创建对象 ”的错误...
  3. npm install是什么命令_了解npm
  4. js中的数组对象排序(方法sort()详细介绍)
  5. 从刘备面试诸葛亮看信息系统项目管理师
  6. 节点+Executor+Core+Task+Partition+RDD+job+DAG+stage+action算子之间的数量关系+两种并行度的区别
  7. 编译器错误 CS1026
  8. ABAP--关于ABAP流程处理的一些命令的说明(stop,exit,return,check,reject)
  9. python遍历txt每一行_python – 计算(和写入)文本文件中每一行的...
  10. go 写文件_GO 文档笔记
  11. Android 相对布局常用属性
  12. shiro filter
  13. ESXi配置vCenter服务器
  14. 中国智能硬件创新产业发展分析2017
  15. 有哪些值得推荐的数据可视化工具?
  16. (转载)SoftIce的安装、配置以及一些基本操作
  17. ArduPilot之遥控器数据读取
  18. deepin C++ 编译错误 file not found 其实是原文件后缀的问题
  19. 校园网同时连手机和电脑、用数据线给电脑连网
  20. php直播系统app吗,ThinkPHP完美运营版安卓苹果双端直播系统APP源码 带主播连麦PK功能源码...

热门文章

  1. GP——数据库常用命令
  2. kido机器人没反应_机器人示教器常见故障及解决方案
  3. 前端获取页面的高度/宽度
  4. jquery报错 $(‘....‘).lazyload is not a function解决方法
  5. 解决LinuxRedhat网卡配置MAC地址冲突问题
  6. 用户在离开计算机锁定功能,短暂离开也不怕 轻松锁定保护用户隐私
  7. 家庭版Windows10怎样添加本地组策略
  8. pika Received remote Channel.Close (403): “ACCESS_REFUSED
  9. [前端项目]微信小程序 小商城
  10. 【AMT 20周年】董事长孔祥云致客户、股东、员工的一封信