PReLU激活函数,方法来自于何凯明paper 《Delving Deep into Rectifiers:Surpassing Human-Level Performance on ImageNet Classification》

PReLU激活

PReLU(Parametric Rectified Linear Unit), 顾名思义:带参数的ReLU。二者的定义和区别如下图: 

如果ai=0,那么PReLU退化为ReLU;如果ai是一个很小的固定值(如ai=0.01),则PReLU退化为Leaky ReLU(LReLU)。 有实验证明,与ReLU相比,LReLU对最终的结果几乎没什么影响。

PReLU的几点说明

(1) PReLU只增加了极少量的参数,也就意味着网络的计算量以及过拟合的危险性都只增加了一点点。特别的,当不同channels使用相同的ai时,参数就更少了。

(2) BP更新ai时,采用的是带动量的更新方式,如下图:

上式的两个系数分别是动量和学习率。 
需要特别注意的是:更新ai时不施加权重衰减(L2正则化),因为这会把ai很大程度上push到0。事实上,即使不加正则化,试验中ai也很少有超过1的。

(3) 整个论文,ai被初始化为0.25。

PReLU与ReLU相关推荐

  1. python不支持prelu_MTCNN(九)更改python与c代码的PReLU为ReLU

    背景:MTCNN的prelu需要训练,并且prelu需要有参数.prelu改为relu之后,相应的参数量会降低并且实现也更简单. 目的:更改MTCNN的prelu为ReLU,并在python端训练出相 ...

  2. 深度学习激活函数总结(sigmoid,tanh,ReLU,Leaky ReLU,EReLU,PReLU,Softmax,Swish,Maxout,Softplus)

    摘要 本文总结了深度学习领域最常见的10中激活函数(sigmoid.Tanh.ReLU.Leaky ReLU.ELU.PReLU.Softmax.Swith.Maxout.Softplus)及其优缺点 ...

  3. 0_3-激活函数的反向传播-ReLU、LeakyReLU、PReLU、ELU、SELU

    numpy实现神经网络系列 工程地址:https://github.com/yizt/numpy_neuron_network 基础知识 0_1-全连接层.损失函数的反向传播 0_2_1-卷积层的反向 ...

  4. 激活函数(relu,prelu,elu,+BN)对比on cifar10

    最近做了个对比实验,通过修改激活函数观察对图片分类准确率的影响,现记录如下: 一.理论基础 1.1激活函数 1.2 elu论文(FAST AND ACCURATE DEEP NETWORK LEARN ...

  5. Pytorch 自定义激活函数前向与反向传播 ReLu系列 含优点与缺点

    文章目录 ReLu 公式 求导过程 优点: 缺点: 自定义ReLu 与Torch定义的比较 可视化 Leaky ReLu PReLu 公式 求导过程 优点: 缺点: 自定义LeakyReLu 与Tor ...

  6. 【CV-Paper 19】PReLU:Delving Deep into Rectifiers

    论文原文:LINK 论文年份:2015 论文被引:9108(2020/10/09) 15056(2022/03/26) 文章目录 Delving Deep into Rectifiers: Surpa ...

  7. 算法基础---ReLU激活函数及其变种

    1 ReLU激活函数提出的背景 1)降低计算量. 早期使用的sigmoid函数,算激活函数时(指数运算),计算量大,反向传播求误差梯度时,求导涉及除法,计算量相对大,而采用Relu激活函数,整个过程的 ...

  8. 1、常用激活函数:Sigmoid、Tanh、ReLU、LReLU、RReLU、ELU

    目录 常用激活函数介绍 1. Sigmoid函数 2.Tanh / 双曲正切激活函数 3.ReLU(rectified linear unit)修正线性单元函数 4.LReLU(Leaky ReLU) ...

  9. Ubuntu14.04上安装TensorRT 2.1操作步骤

    在Ubuntu14.04 上安装TensorRT2.1有两种方法:(1).通过.deb直接安装:(2).通过Tar文件安装.这里通过Tar文件安装. 安装步骤: 1. 安装CUDA 8.0,可参考:  ...

最新文章

  1. Nagios配置之交换机及路由
  2. 2、MySQL错误日志(Error Log)详解
  3. 微信小程序websocket连接服务器(接收信息)
  4. hibernate--
  5. 学习笔记day5:inline inline-block block区别
  6. 做科研,到底应该看什么?
  7. Linux驱动(8)--内核编译与配置
  8. 数字中国城市巡礼之乌兰察布:红山口上的“草原硅谷”
  9. causal snps | causal variants | tensorflow | 神经网络实战 | Data Simulation
  10. 春季必买明星款流行春装
  11. 等了十年的微信功能终于成真
  12. java 生成纯色图片_canvas简单实现纯色背景图片抠图(示例代码)
  13. Xilinx-ZYNQ7000系列-学习笔记(1):用XADC测外部温度值
  14. 超全,Python 量化金融库汇总!
  15. Python 调试器 - ipdb
  16. discuz mysql类_Discuz X2二次开发之数据库操作 DB类
  17. 小码农也有大梦想!Java程序培训哪里好
  18. BurpSuite插件
  19. 苹果6s强制删除id锁_苹果手机忘了解锁密码不要慌,你可以这样做!
  20. jQuery轮播图之上下轮播

热门文章

  1. C语言中的* 简单记忆方法
  2. Tridium niagara N4---报警告警信息点设置
  3. python中0x3f_单片机中0x3f代表什么意思
  4. 随记-简单而优雅的 namedtuple
  5. OpenSSl生成SSL证书(支持https)
  6. c语言排序常用问题,【更新中】【排序详解】解决排序问题(以C语言为例)
  7. php输入框里的提示文字,input 标签实现输入框带提示文字效果(两种方法)
  8. MyBatis - 批量插入
  9. C#中悲观锁和乐观锁
  10. 跨站脚本攻击(XSS)详解