深度学习笔记03——浅析Softmax作用
Softmax为一个函数,一般用于处理分类任务中初始输出结果。
首先对于一个分类的任务,它的输出一般为一个向量。因为可以通过向量的方式来表示某个类别。比如如下label的三个类别:
这个是label结果,不是分类网络的输出结果。而分类网络的输出结果也是一个向量,只是这个向量里面的值可以为任何值,即不是像label一样这么有规律。我们知道我们需要用分类网络的输出结果和label进行cross entropy 来计算loss。往往用于与label进行计算的那个输出向量不是最开始网络输出的输出向量,而是经过了softmax后的向量。
softmax的作用是:将可以为任何值的vector映射为vector内每个值属于(0,1),所有值之和=1,可以理解为概率。比如经过softmax后的vector为[0.88,0.12,0] ,那么这个图片为第一类的P=0.88。下图是整个过程:
Softmax里面进行操作如下:
给一个实际的例子:可以理解softmax的效果就是让大值与小值差距更大。
其他:
当分类任务中只有两个类别时,使用sigmoid它的效果与softmax是等价的。
Pytorch中softmax是集成在cross-entropy模块里的,也就是说当选择cross-entropy作为Loss时,你不需要再额外加softmax层,它自己内部就已经实现了。
深度学习笔记03——浅析Softmax作用相关推荐
- 深度学习笔记三:Softmax Regression
Softmax回归模型 整体理解 回归与分类 借用网上一个帖子的回复:分类问题和回归问题都要根据训练样本找到一个实值函数g(x). 回归问题的要求是:给定一个新的模式,根据训练集推断它所对应的输出y( ...
- 深度学习笔记(13) Softmax分类
深度学习笔记(13) Softmax分类 1. Softmax 回归 2. 练一个Softmax分类器 1. Softmax 回归 有一种logistic回归的一般形式,叫做 Softmax回归 能在 ...
- 深度学习笔记(24) 卷积层
深度学习笔记(24) 卷积层 1. 卷积层向前传播 2. 卷积层符号 3. 简单的卷积网络 1. 卷积层向前传播 一个典型的卷积神经网络的卷积层,而通常有三层: 卷积层 Conv 池化层 POOL 全 ...
- 深度学习笔记其五:卷积神经网络和PYTORCH
深度学习笔记其五:卷积神经网络和PYTORCH 1. 从全连接层到卷积 1.1 不变性 1.2 多层感知机的限制 1.2.1 平移不变性 1.2.2 局部性 1.3 卷积 1.4 "沃尔多在 ...
- 《繁凡的深度学习笔记》前言、目录大纲 一文让你完全弄懂深度学习所有基础(DL笔记整理系列)
<繁凡的深度学习笔记>前言.目录大纲 (DL笔记整理系列) 一文弄懂深度学习所有基础 ! 3043331995@qq.com https://fanfansann.blog.csdn.ne ...
- 一文弄懂元学习 (Meta Learing)(附代码实战)《繁凡的深度学习笔记》第 15 章 元学习详解 (上)万字中文综述
<繁凡的深度学习笔记>第 15 章 元学习详解 (上)万字中文综述(DL笔记整理系列) 3043331995@qq.com https://fanfansann.blog.csdn.net ...
- 深度学习笔记(43) Siamese网络
深度学习笔记(43) Siamese网络 1. Siamese网络 2. 建立人脸识别系统 3. 训练网络 1. Siamese网络 深度学习笔记(42) 人脸识别 提到的函数ddd的作用: 输入两张 ...
- 深度学习笔记(35) 滑动窗口的卷积实现
深度学习笔记(35) 滑动窗口的卷积实现 1. 卷积实现 2. 减少计算成本 1. 卷积实现 为了构建滑动窗口的卷积应用,首先要知道如何把神经网络的全连接层转化成卷积层 假设对象检测算法输入一个14× ...
- 深度学习笔记(30) Inception网络
深度学习笔记(30) Inception网络 1. Inception模块 2. 瓶颈层 3. Inception网络 4. Inception网络的细节 1. Inception模块 构建卷积层时 ...
最新文章
- HashTable 使用例子
- Java关键字final使用详解
- 【CF1307F】Cow and Vacation(并查集+lca倍增)
- CentOS SSH公钥登录问题
- linux python命令无反应_Python学习第164课--Linux命令行特殊符号的意义及命令的语法规则...
- 《CCNP TSHOOT 300-135学习指南》——1.2节结构化故障检测与排除方法
- 高质量的用户体验 推进IT运维向业务服务转变——中国移动通信集团公司
- 物流管理系统需要的服务器,物流业务管理系统
- 以下选项不是python文本处理方向第三方库_Python程序设计-超星尔雅-学习通-题库零氪...
- 本科课程【数字图像处理】实验1 - 腐蚀与膨胀
- Hadoop版本区别Hadoop组成
- 熊出没机器人光头强_《熊出没》里的温馨时刻,原来光头强和熊大熊二的关系也能这么好...
- ktv点歌系统主界面java_欢迎进入MyKTV前后台点歌系统展示
- c语言 设圆的半径,【c语言】设圆半径r = 1.5,圆柱高h = 3,求圆周长,圆面积,圆球表面积,圆球体积,圆柱体积...
- STM32显示图片,将图片转换为十六进制数组便捷工具
- Go内存溢出与内存泄露
- 程序员应该学习如何学习
- 采集绿盾网的10个经典方法
- 射频混频器matlab,一个很多射频/天线工程师不知道的神奇网站
- Elasticsearch 6.x Mapping设置