softmax函数为什么叫softmax?
之前一直很奇怪这个名字,本身是做一个类似归一化的动作,把整体一个vector“压缩”成一个符合概率分布的样子,为什么叫softmax呢?
今天查了下,看了下部分答案,大概写一下理解。
softmax,是和hard-max来对应的。
他完成了两个功能,一个是max,一个是soft。
max部分:softmax函数处理之后,整体最大的值还是最大值,这个排序顺序没有变化,相当于大小顺序的信息没有丢失;
soft部分:soft意味着,是一种可以反向恢复的一种转换。与之对应的,是hard转换。比如说,我们定义对一个vector的hard-max函数,要求也是转变成一个概率分布,单项在[0,1]之间,sum为1。那么,可以定义hard-max为:
Hard-max(vector) = [1 if x is max else 0 for x in vector]
可以看出,这个定义的hard-max也满足概率分布的条件,但它是不可逆的。算是“硬转换”。
因此,对比起来,这个soft-max函数算是一种soft(可逆的)max函数转换为一个概率分布的vector。
参考:
1. https://math.stackexchange.com/questions/1888141/why-is-the-softmax-function-called-that-way
softmax函数为什么叫softmax?相关推荐
- [Machine Learning] logistic函数和softmax函数
简单总结一下机器学习最常见的两个函数,一个是logistic函数,另一个是softmax函数,若有不足之处,希望大家可以帮忙指正.本文首先分别介绍logistic函数和softmax函数的定义和应用, ...
- softmax函数上溢出和下溢出(转载+自己理解)
<Deep Learning>(Ian Goodfellow & Yoshua Bengio & Aaron Courville)第四章「数值计算」中,谈到了上溢出(ove ...
- What is the Softmax Function?详解机器学习中的Softmax函数【小白菜可懂】
目录 定义 公式 计算 Softmax vs Sigmoid Softmax vs Sigmoid 计算 Softmax vs Argmax Softmax vs Argmax 计算 应用 神经网络中 ...
- 积水成渊之softmax函数
积水成渊之softmax函数 导引 什么是Softmax函数? 公式Softmax(xi)=exi∑j=1nexjSoftmax(x_i)=\frac{e^{x_i}}{\sum_{j=1}^{n}e ...
- 深度学习入门(六)——softmax函数的改良
输出层的设计 机器学习的问题大致可以分为分类问题和回归问题.分类问题是数据属于哪一个类别的问题.比如,区分图像中的人是男性还是女性的问题就是分类问题.而回归问题是根据某个输入预测一个(连续的)数值的问 ...
- Tranformer模型与Softmax函数
目录 Softmax函数的FPGA实现 查表法 CORDIC算法的简介 泰勒级数展开法 多项式拟合法: 参考文献 Transformer模型中抛弃了传统的CNN和RNN,整个网络结构完全是由Atten ...
- Softmax函数求导
来源:https://blog.csdn.net/zt_1995/article/details/62227603 其实整个推导,上面这个图片已经介绍得十分清楚了,但是仍有很多小步骤被省略掉了,我会补 ...
- 机器学习 [logistic函数和softmax函数]
简单总结一下机器学习最常见的两个函数,一个是logistic函数,另一个是softmax函数,若有不足之处,希望大家可以帮忙指正.本文首先分别介绍logistic函数和softmax函数的定义和应用, ...
- logistic函数和softmax函数
简单总结一下机器学习最常见的两个函数,一个是logistic函数,另一个是softmax函数.本文首先分别介绍logistic函数和softmax函数的定义和应用,然后针对两者的联系和区别进行了总结. ...
最新文章
- Direct2D教程(三)简单几何图形
- Java Cardioid 心脏形曲线 (整理)
- 秒杀系统流量削峰,这事应该怎么做?
- Javaweb学习路线(自学规划)
- 导出Oracle数据库字典
- php postgresql win,Windows PHP上的PostgreSQL问题
- Web Application Projects的一个问题
- 用浏览器控制台查看ajax请求
- 10.软件架构设计:大型网站技术架构与业务架构融合之道 --- 事务一致性
- bulk insert java_从JAVA插入SQL Server时,我可以获得“BULK INSERT”般的速度吗?
- 重温LuGre摩擦力模型
- Java开源J2EE框架
- JQuery提交表单
- 使用DragonFly进行智能镜像分发
- JAVA动态桌面制作_自己动手制作安卓动态壁纸教
- 昇腾Mindstudio官方样例黑白图片上色
- ipad iphone开发_如何在iPhone或iPad上“不信任”计算机
- 我的计算机关闭不了怎么办,我的电脑怎么关不了机 该怎么办【图文】
- CoLab - 图像人脸检测_框出人脸
- dmr中继 自建服务器,海能达DMR中继接入BrandMeister教程
热门文章
- 【Android开发经验】移动设备的“声波通信/验证”的实现——SinVoice开源项目介绍(一)
- CSP认证201709-4	通信网络[C++题解]:dfs、建立两张图:正向建图和反向见图、统计联通点的个数
- Leetcode455分饼干-贪心
- telnet工具_Telnet进入Linux时出现乱码
- python调用函数传参时、有默认值的在中间 报错了_python的大坑:使用空列表作为默认参数,让我怀疑遇到了灵异代码...
- 快速mysql导入sql文件_mysql肿么快速从sql文件导入数据库
- 微软模拟飞行2020服务器多少内存,《微软模拟飞行2020》配置公开,想玩爽还需玩家加大投入...
- 优化缩短关中断的时间
- 文本编辑器中实现自动换行的功能
- 普中28335开发攻略_TMS320F28335项目开发记录1_CCS的使用介绍