之前在使用activation function的时候只是根据自己的经验来用,例如二分类使用sigmoid或者softmax,多分类使用softmax,Dense一般都是Relu,例如tanh几乎没用过,最近在复线别人代码的时候发现别人Dense层使用的tanh激活函数,所以决定系统的看一下各类激活函数以及其优缺点。

激活函数分类线性和非线性,例如Dense层如果不指定激活函数则会默认activation = ‘linear’,常见的非线性激活函数有sigmoid、softmax、relu、tanh等。

一、Sigmoid函数

sigmoid激活函数的优点是它是便于求导的平滑函数,但是缺点有:

1、容易出现梯度消散现象

2、函数的输出并不是zero-centered的

3、幂运算相对耗时

二、tanh函数

tanh函数解决了zero-centered问题,但是梯度消散和幂运算问题依旧存在。

三、ReLu函数

ReLU函数其实就是取最大值,虽然很简单但是有很多优点:

1、解决了梯度消散的问题(在正区间)

2、计算速度快

3、收敛速度快

但是ReLU也有一些问题:

1、ReLU的输出不是zero-cemtered

2、可能会导致某些神经元永远不会被激活,从而导致对应的参数不能被更新。主要有两种可能导致这种现象的情况:(1)非常不幸的参数初始化 (2)学习率太高

但是整体来看目前最好用的还是ReLU!!!

各种activation function(激活函数) 简介相关推荐

  1. 激活函数 activation function

    文章目录 激活函数 activation function Sigmoid Sigmoid 反向传播 Tanh ReLU Dead ReLU Problem 产生的原因 激活函数 activation ...

  2. 激活函数(activation function)

    激活函数activation function 激活函数的介绍 阶跃函数(Step Function)--- 最简单的二分类非线性激活函数开始 mish激活函数 激活函数的介绍 首先看一个普通的神经网 ...

  3. 激活函数(Activation Function)及十大常见激活函数

    目录 1 激活函数的概念和作用 1.1 激活函数的概念 1.2 激活函数的作用 1.3 通俗地理解一下激活函数(图文结合) 1.3.1 无激活函数的神经网络 1.3.2 带激活函数的神经网络 2 神经 ...

  4. 深度学习中常见的10种激活函数(Activation Function)总结

    目录 一:简介 二:为什么要用激活函数 三:激活函数的分类 四:常见的几种激活函数 4.1.Sigmoid函数 4.2.Tanh函数 4.3.ReLU函数 4.4.Leaky Relu函数 4.5.P ...

  5. Homepage Machine Learning Algorithm 浅谈深度学习中的激活函数 - The Activation Function in Deep Learning

    原文地址:http://www.cnblogs.com/rgvb178/p/6055213.html 版权声明:本文为博主原创文章,未经博主允许不得转载. 激活函数的作用 首先,激活函数不是真的要去激 ...

  6. MXNet 定义新激活函数(Custom new activation function)

    https://blog.csdn.net/weixin_34260991/article/details/87106463 这里使用比较简单的定义方式,只是在原有的激活函数调用中加入. 准备工作 下 ...

  7. [TensorFlow 学习笔记-06]激活函数(Activation Function)

    [版权说明] TensorFlow 学习笔记参考:  李嘉璇 著 TensorFlow技术解析与实战 黄文坚 唐源 著 TensorFlow实战郑泽宇  顾思宇 著 TensorFlow实战Googl ...

  8. 浅谈深度学习中的激活函数 - The Activation Function in Deep Learning

    原文地址:http://www.cnblogs.com/rgvb178/p/6055213.html 版权声明:本文为博主原创文章,未经博主允许不得转载. 激活函数的作用 首先,激活函数不是真的要去激 ...

  9. 【机器学习】神经网络-激活函数-面面观(Activation Function)

    神经网络之激活函数(Activation Function) 本博客仅为作者记录笔记之用,不免有很多细节不对之处. 还望各位看官能够见谅,欢迎批评指正. 更多相关博客请猛戳:http://blog.c ...

最新文章

  1. MySQL 语句整理 2019-5-3
  2. http 400错误
  3. Dispatch 方法简介
  4. 蓝图中实现人物移动1
  5. linux内核的I2C子系统详解4——i2c-s3c2410.c文件中的adapter、algorithm
  6. mac mysql-share_mac下安装mysql
  7. Python模拟新浪微博登录转载,是我的那篇资料来源
  8. android 签名打包 Invalid keystore format
  9. 1口百兆光纤收发器工业导轨式发送机接收机1百兆光1百兆电工业以太网光纤收发器
  10. 产品经理如何写好一份简历
  11. 简历推荐_5位AI产品经理
  12. 产品读书《人类简史》
  13. [内附完整源码和文档] 基于Java的人事档案管理系统
  14. 计算机点击桌面无反应,为什么鼠标点击桌面图标没反应?
  15. mysql每秒写入量_MySQL每秒可以插入多少条记录?影响MySQL插入速度的因素有哪些?...
  16. Mac conda 使用
  17. 11.组合查询union
  18. 工控系统主动安全防御体系的构建
  19. Oracle中where后面加if,SQL:WHERE子句中的IF子句
  20. “事件营销”不等于“活动营销”

热门文章

  1. 手游《六大门派》 武侠MMORPG手机游戏全套源码下载
  2. AE基础教程(1)——第1章 影视后期专业导论
  3. 【Python数据清洗】pivot_table 与 pivot 的区别——手把手系列
  4. 如何判断自己是不是社恐?
  5. 比尔盖茨与乔布斯,你们觉得,二人谁更伟大
  6. 响应式黄色高端家居装修生活空间类网站pbootcms模板(PC+WAP)
  7. 区块链零知识证明:STARKs, Part II
  8. 2022年初级会计考试综合试题及答案
  9. JEC-QA:A Legal-Domain Question Answering Dataset 论文阅读
  10. 【并发】2、JMM三大特性与Volatile