优点:

a. 克服梯度消失的问题
b. 加快训练速度

缺点:

a. 0 点连续不可导(直上直下),梯度下降过程中不那么流畅。
b. ReLU 只有正值,没有负值,bp 时有 zigzag 现象, 容易陷入局部最优。
c. 当 x<0 时,结果为0,有信息损失。

对于缺点b解释如下:


       公式第一行是正向传播计算公式,其中x为经过激活函数后的上一个神经元,f 为当前神经元,如果使用ReLU激活函数的话,x的值是大于0的。第二行是 f 对 w 求偏导,结果为 x,是大于 0 的,第三行是损失函数L对权重w求偏导(即w的梯度,更新权重时要用,也是我们反向传播的最终目的),结果等于 L 对 f 求偏导乘以x。此时x的值一定是大于0的,因此可以得出 L 对于 w 的偏导的符号就等于 L 对于 f 的偏导的符号(符号即正或负)。权重导数的符号可以等价于权重更新的方向,所以最终可以得出所有的权重w都会朝着一个方向更新,方向取决于L对于f求偏导的符号,正或者负。

如右图所示,假设w_i只有w1和w2两个值。那么由以上推断可以得出,w1和w2每次更新的方向是一致的,因此权重最终的更新过程便如右图所示。那么更新时走的路程会更长,就更容易进入局部最小值点,假设此时局部最小值点不可导,那么权重将无法更新。

【激活函数】ReLU激活函数的思考相关推荐

  1. tensorflow中Relu激活函数

    tensorflow中Relu激活函数 引用API:tensorflow.nn.relu(x) 初学者建议选择Relu激活函数 Relu激活函数 Relu激活函数是一个分段函数,只需要考虑值是否大于0 ...

  2. 转:ReLU激活函数:简单之美

    纯粹学习收藏. 转载地址:https://blog.csdn.net/cherrylvlei/article/details/53149381 导语 在深度神经网络中,通常使用一种叫修正线性单元(Re ...

  3. 为什么要ReLU激活函数

    导语 在深度神经网络中,通常使用一种叫修正线性单元(Rectified linear unit,ReLU)作为神经元的激活函数.ReLU起源于神经科学的研究:2001年,Dayan.Abott从生物学 ...

  4. ReLU激活函数:简单之美

    导语 在深度神经网络中,通常使用一种叫**修正线性单元(Rectified linear unit,ReLU)**作为神经元的激活函数.ReLU起源于神经科学的研究:2001年,Dayan.Abott ...

  5. 使用opencv dnn 模块调用darknet模型时候出错,不支持relu激活函数

    问题: 使用opencv dnn 模块调用darknet模型时候出错,报错信息为 不支持relu激活函数 以下过程为笔者自己解决该问题的过程,供各位参考学些,因为中间又遇到新的坑,所以各位务必看完再决 ...

  6. 零基础学caffe源码 ReLU激活函数

    零基础学caffe源码 ReLU激活函数 原创 2016年08月03日 17:30:19 1.如何有效阅读caffe源码 1.caffe源码阅读路线最好是从src/cafffe/proto/caffe ...

  7. 【深度学习】ReLU激活函数的缺点

    关于ReLU的详细介绍可以参考: ReLU激活函数 - 知乎 训练的时候很"脆弱",很容易就"die"了,训练过程该函数不适应较大梯度输入,因为在参数更新以后, ...

  8. 卷积神经网络(卷积层,激活函数Relu,池化层,计算公式及API解释)

    1. 卷积神经网络 (卷积层,激活函数,池化层,全连接层) (1)  把神经网络的隐藏层分为卷积层和池化层(又叫下采样层) · 卷积层 :  通过在原始图像上平移来提取特征 ·  池化层 : 通过特征 ...

  9. input自适应_一种Dynamic ReLU:自适应参数化ReLU激活函数(调参记录13)

    自适应参数化ReLU,本身就是一种动态的ReLU(Dynamic ReLU,Dy-ReLU).该论文在2019年5月的时候,投稿到IEEE Transactions on Industrial Ele ...

最新文章

  1. Netscaler 认证,访问报http 5000 内部错误
  2. python的unittest測试框架的扩展浅谈
  3. 【VMware虚拟化解决方案】VMware VSphere 5.1配置篇
  4. tf.control_dependencies()控制计算流图
  5. oracle 表更新表,Oracle 更新表(另一张表)
  6. tomcat常用功能
  7. SAE助力「海底小纵队学英语」全面拥抱Serverless,节省25%以上成本
  8. rocketmq 重复消费_消息队列 RocketMQ
  9. 【Kafka】Kafka事务是怎么实现的
  10. java数据结构- - - -栈
  11. console线驱动安装_文通证件识别SDK和驱动安装使用说明
  12. 卸载loadrunner
  13. jfinal 获得 webapp 文件下文件路径
  14. CentOS安装MySQL及其使用(总结整理)
  15. 【极客】神器——常用的一些小工具
  16. 图灵科普数学宝藏书单|购书狂欢618倒计时,这份书单闭眼入
  17. C# Winform设置焦点
  18. 计算机中丢失glut.dll,OpenGl的源程序,运行就提示,计算机丢失 glut32.dll文件
  19. 高强度间歇训练(HIIT)
  20. sql loader导出数据和导入数据(sqlldr)

热门文章

  1. 关于装配学校计算机教室报告,计算机室工作计划
  2. 2021-03-05小根堆
  3. std::move()源码分析
  4. 1001.双系统互联的坑
  5. python制作一个简单的udp聊天器
  6. 用Excel教会你PID算法
  7. 机票预定系统类图_出行干货|在法国,廉价机票攻略
  8. iphone实用配置工具_Debookee for Mac(网络数据抓包及分析工具)
  9. linux input输入子系统分析《二》:s3c2440的ADC简单驱动实例分析
  10. linux 安装flash tar.gz,ubuntu下安装flash(tar.gz格式)