点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

当你在苦扒图像处理方法得时候

他在用深度学习

当你在干瞪切片像素得时候

他在用深度学习

当你在愁思小偷是谁得时候

他在用深度学习

当你拥堵在北二环得时候

。。。

现在来扒扒深度学习网络心脏

激活函数

全篇概述:

深度学习在训练的过程中常常要用到激活函数

    “说,目的是啥?”

    “目的是为了让多层网络之间进行非线性变换”

    “如果不用呢?”

    “不用的话,多层的线性网络的表达能力与单层网络的表达能力是一样的,要不就没意思了”

 TA 说:

     在使用tensorflow的过程中我发现它提供了以下几个函数:sigmoid、tanh、elu、relu等。

   “还等啥啊,赶紧给我讲”

    听老衲给施主絮絮叨叨、

    咱竹板这么一打啊,别的咱不夸,夸一夸激活函数呐!

函数一:sigmoid

   分析

从图像中我们可以看出当我们输入的数据非常小或非常大时它的值是0或者1那么它的梯度很小趋近于0。

在反向传播中,这个局部梯度会与整个代价函数关于该单元输出的梯度相乘,结果会接近为 0。此时相当于没有信号传到神经元,权重不会更新。

还有一个问题是:sigmoid的值总是为正值。

如果输入都是正值那么梯度总为正或负这会导致训练的时候呈现Z字形梯度下降。

函数二:Tanh

双曲正切tanh读作/tæntʃ/

有着对比精神,可以看到tanh函数其实是sigmoid函数的变形

同样的tanh函数也存在饱和的问题,不过tanh函数的值经过原点

并且函数值在(-1,1)之间的不同于sigmoid值总是为正值或负值

函数三:Relu

Relu(Rectified Linear Units)读 /'relju/

f(u) = max ( 0, u )

可以看到反向传播的时候梯度要么是0要么不变,所以梯度衰减很小,经过很多层也不会减弱.收敛的速度会比tanh和sigmoid快。

不过有个缺点是当x<0时 f '(x)=0 (z) (这里是导函数为零)所有负梯度到这都变成0,且这个神经元有可能再也不被激活,神经元的梯度永远都是0.

函数四:Elu

Elu函数是sigmoid和relu的结合体。

当x<0时,跟relu不一样的函数值趋近于-1,使elu能够对输入具有更强的鲁棒性

当下x>0时线性部分能够缓解梯度消失,Elu的输出均值是接近于0的,因此它的收敛会更快。

本文函数都是深度学习常用的激活函数当然还有其它的,大家可以维基百科!大家有其他看法,或者这里有漏洞都可以在群中探讨,欢迎留言或赞赏。

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

趣谈深度学习核心----激活函数相关推荐

  1. 汤晓鸥谈深度学习三大核心要素:算法设计、高性能的计算能力以及大数据

    汤晓鸥谈深度学习三大核心要素:算法设计.高性能的计算能力以及大数据 2017-05-21 15:02:28    深度学习    0 0 0 昨日(5月20日),香港中文大学汤晓鸥教授莅临 2017C ...

  2. 深度学习常用激活函数

    在感知器模型.神经网络模型.深度学习模型中均会看见激活函数的声影.激活函数又被称为转移函数.激励函数.传输函数或限幅函数,其作用就是将可能的无限域变换到一指定的有限范围内输出,这类似于生物神经元具有的 ...

  3. 周志华:浅谈深度学习

    我们都知道直接掀起人工智能热潮的最重要的技术之一,就是深度学习技术.今天,其实深度学习已经有各种各样的应用,到处都是它,不管图像也好,视频也好,声音自然语言处理等等.那么我们问一个问题,什么是深度学习 ...

  4. 737 页《吴恩达深度学习核心笔记》发布,黄海广博士整理!

    点击上方"AI有道",选择"置顶"公众号 重磅干货,第一时间送达 深度学习入门首推课程就是吴恩达的深度学习专项课程系列的 5 门课.该专项课程最大的特色就是内容 ...

  5. 浅谈深度学习:LSTM对股票的收益进行预测(Sequential 序贯模型,Keras实现)

    浅谈深度学习:LSTM对股票的收益进行预测(Sequential 序贯模型,Keras实现) 总包含文章: 一个完整的机器学习模型的流程 浅谈深度学习:了解RNN和构建并预测 浅谈深度学习:基于对LS ...

  6. 浅谈深度学习:了解RNN和构建并预测

    浅谈深度学习:了解RNN和构建并预测 总包含文章: 一个完整的机器学习模型的流程 浅谈深度学习:了解RNN和构建并预测 浅谈深度学习:基于对LSTM项目LSTM Neural Network for ...

  7. 浅谈深度学习:基于对LSTM项目`LSTM Neural Network for Time Series Prediction`的理解与回顾

    浅谈深度学习:基于对LSTM项目LSTM Neural Network for Time Series Prediction的理解与回顾#### 总包含文章: 一个完整的机器学习模型的流程 浅谈深度学 ...

  8. 嵌入式AI —— 6. 为糖葫芦加糖,浅谈深度学习中的数据增广

    没有读过本系列前几期文章的朋友,需要先回顾下已发表的文章: 开篇大吉 集成AI模块到系统中 模型的部署 CMSIS-NN介绍 从穿糖葫芦到织深度神经网络 又和大家见面了,上次本程序猿介绍了CMSIS- ...

  9. 浅谈深度学习的基础——神经网络算法(科普)

    浅谈深度学习的基础--神经网络算法(科普) 神经网络算法是一门重要的机器学习技术.它是目前最为火热的研究方向--深度学习的基础.学习神经网络不仅可以让你掌握一门强大的机器学习方法,同时也可以更好地帮助 ...

最新文章

  1. CSS.text不被选中
  2. 机器人大潮中暗藏多少伪命题
  3. FlashFTP工具的自动缓存服务器目录的功能
  4. 【杂谈】为什么Pytorch这么好用我还苦口婆心推荐初学者也学习一下caffe?
  5. Bootstrap 输入框组中控件的尺寸
  6. Linux内核部件分析 设备驱动模型之device-driver
  7. Python 数据处理 | 详解缩尾处理(winsorize)和代码实践
  8. 图像处理一之-摄像头二值化处理-(什么是二值化)
  9. ddm模型公式_cfa讲义-估值中的折现方法-DDM模型(2)
  10. labview 写入mysql_LabVIEW 连接MySQL数据库
  11. Matlab DCT详解
  12. 假设今天是2015年3月1号星期日,计算13个月零6天后是星期几?距离现在多少秒?
  13. Ubuntu无法解析域名
  14. Topcoder口胡记 SRM 562 Div 1 ~ SRM 599 Div 1
  15. (自学)sklearn决策树基础知识|解决centos7.8 graphviz报错不能画图的问题
  16. 对于美国中部覆盖图防护林形态的自动检测技术
  17. GB28181 安卓移动设备位置上报实现(订阅和通知实现)
  18. arduino智能闹钟_【Arduino综合项目】小闹钟
  19. bzoj1671 Knights of Ni 骑士 BFS
  20. 用js获取某一年一共多少天和剩余天数

热门文章

  1. 一行Python代码能实现这么多丧心病狂的功能?(代码可复制)
  2. 推荐系统遇上深度学习,9篇阿里推荐论文汇总!
  3. 清华北大“世界排名断崖式下跌”?
  4. 渗透各行各业,这家RPA外企宣布全面进军中国市场
  5. 双十一,程序员前女友发来消息。。。
  6. 太牛了!22岁本科生Github上开源的后台管理系统,太实用(附源码)!
  7. Spring发布新成员:Spring GraphQL!高调出场的GraphQL能火起来了吗?
  8. 高并发下如何保证接口的幂等性?
  9. 面试官:磁盘 IO 变高,你怎么分析?
  10. 数据量大了一定要分表,分库分表 Sharding-JDBC 入门与项目实战