因为数据的分布绝大多数是非线性的,一般神经网络的计算是线性的,那么引入激活函数,是在神经网络中引入非线性,就强化网络的学习能力。所以激活函数的最大特点就是非线性。而且能够使输出映射到有限区间之内,便于计算。能够使网络快速地收敛,计算效率高。

激活函数

激活函数(Activation Function),就是在人工神经网络的神经元上运行的函数,负责将神经元的输入映射到输出端。

激活函数给神经元引入了非线性因素,使得神经网络可以任意逼近任何非线性函数,这样神经网络就可以应用到众多的非线性模型中。

常用的激活函数

Sigmoid激活函数

sigmoid函数也叫Logistic函数,用于隐藏层的输出,输出在(0,1)之间,它可以将一个实数映射到(0,1)的范围内,可以用来做二分类。常用于:在特征相差比较复杂或是相差不是特别大的时候效果比较好。该函数将大的负数转换成0,将大的正数转换为1。函数公式如下:

函数曲线及求导曲线:

       

sigmod函数的取值范围在(0, 1)之间,可以将网络的输出映射在这一范围,方便分析。

优点:平滑、易于求导。

缺点:

  • 梯度消失:Sigmoid 函数趋近 0 和 1 的时候变化率会变得平坦,也就是说,Sigmoid 的梯度趋近于 0。神经网络使用 Sigmoid 激活函数进行反向传播时,输出接近 0 或 1 的神经元其梯度趋近于 0。
  • 不以零为中心:Sigmoid 输出不以零为中心的。
  • 计算成本高昂:exp() 函数与其他非线性激活函数相比,计算成本高昂。

Tanh激活函数

Tanh激活函数又叫作双曲正切激活函数,是双曲函数中的一个,Tanh()为双曲正切。在数学中,双曲正切“Tanh”是由基本双曲函数双曲正弦和双曲余弦推导而来。函数公式如下:

tanh(x) = 2sigmoid(2x)-1

函数曲线及求导曲线:

   

Tanh 函数将数据压缩至-1 到 1 的区间内。Tanh 函数的输出以零为中心,因为区间在-1 到 1 之间。负数输入被当作负值,零输入值的映射接近零,正数输入被当作正值。

优点:它解决了Sigmoid函数的不是zero-centered输出问题。

缺点:梯度消失(gradient vanishing)的问题和幂运算的问题仍然存在。

Relu激活函数

Relu函数是修正线性单元函数,函数形式比较简单,函数公式如下:

f(x)=max(0, x)

Relu函数曲线及求导曲线:

      

优点:当输入 x<0 时,输出为 0,当 x> 0 时,输出为 x。该激活函数使网络更快速地收敛。在正区域(x> 0 时)它可以对抗梯度消失问题。由于使用了简单的阈值化,ReLU 计算效率很高。

缺点:不以零为中心。前向传导过程中,如果 x < 0,则神经元保持非激活状态,且在后向传导中「杀死」梯度。

Leaky Relu激活函数

为了解决 ReLU 激活函数中的梯度消失问题,当 x < 0 时,使用 Leaky ReLU——该函数试图修复 dead ReLU 问题。

Leaky Relu激活函数公式:LeakyRelu = max(0.01,x)

Leaky Relu函数及求导曲线:

Leaky ReLU函数:当 x < 0 时,它得到 0.01 的正梯度。

优点:该函数一定程度上缓解了 dead ReLU 问题。

缺点:使用该函数的结果并不连贯。尽管它具备 ReLU 激活函数的所有特征,如计算高效、快速收敛、在正区域内不会饱和。

AI人工智能学习之激活函数相关推荐

  1. 超全的AI人工智能学习路线图(内含大纲+视频+工具)

    为了让自学者们得到更贴合市场.更权威的AI人工智能学习资料,我向黑马申请到了很多新视频,很骄傲能给广大自学者提供一个这样优秀的学习资源(偷笑).不用理解我整理的辛苦,不用理解我整理时累的眼角都流哈喇子 ...

  2. AI 人工智能学习路线

    前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家.点击跳转到教程. 相关视频资料下载见:https://blog.csdn.net/qwxwaty/article/de ...

  3. AI人工智能学习路径图

    都看了昨天的热搜没有?韩国首位AI女主播金柱夏诞生,瞧瞧,这就是科技的力量啊!用智能代替人工解放人力,相信在未来这一定是个大的发展趋势,这时候可能就有人想要进入这个行业了,那么今天,小编就来给大家分享 ...

  4. AI 人工智能学习经典书单

    人工智能相关岗位中,涉及到的内容包含: 算法.深度学习.机器学习.自然语言处理.数据结构.Tensorflow.Python .数据挖掘.搜索开发.神经网络.视觉度量.图像识别.语音识别.推荐系统.系 ...

  5. 干货福利:AI人工智能学习资料教程包.zip

    近几年来人工智能常常成为热门议题,经久不衰. 2020年以来,在各种政策红利催化.5G商用助推.物联网.大数据.AI芯片技术大规模落地后,几乎所有人都已经笃定,人工智能就是IT人未来的新风向. 不过有 ...

  6. 【AI人工智能学习】GitHub 上适合初学者的 10 个最佳开源 AI 项目

    温馨提示:AI一定是未来程序员的出路,大家可以早点入坑. 目录 人工智能简介 GitHub 上适合初学者的 10 个最佳开源 AI 项目 Part.1 TensorFlow Part.2 PyTorc ...

  7. AI人工智能学习之回归分析

    回归分析 在统计学中,回归分析(regression analysis)指的是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法.回归分析按照涉及的变量的多少,分为一元回归和多元回归分析:按 ...

  8. AI 人工智能学习之假设检验

    假设检验 假设检验(hypothesis testing),又称统计假设检验,是用来判断样本与样本.样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法.显著性检验是假设检验中最常用的一种方 ...

  9. AI 人工智能学习之方差分析

    方差分析 方差分析(简称ANOVA),用于两个及两个以上样本均数差别的显著性检验.方差分析通过检验多个总体的均值是否相等来判断一个或多个分类型自变量对数值型因变量是否由显著影响. 它形式上是比较总体均 ...

最新文章

  1. 【每日一算法】有效的括号
  2. Spring 注解 @bean 和 @component 的区别, 你知道吗?
  3. WARNING:tensorflow:Layer gru will not use cuDNN kernels since it doesn‘t meet the criteria. It will
  4. CMake手册详解 (十二)
  5. 【学术相关】科技论文写作:grammerly润色工具
  6. tensorflow保存模型和加载模型的方法(Python和Android)
  7. 【今日CV 视觉论文速览】19 Feb 2019
  8. android 底部圆角,android 实现部分圆角图片
  9. 2022 软件测试工程师面试题小结【附带答案】
  10. FFmpeg源代码简单分析:libavdevice的gdigrab
  11. Hershell:跨平台反向Shell生成器
  12. An Adaptive Stochastic Dominant Learning Swarm Optimizer for High-Dimensional Optimization 阅读笔记
  13. 波浪谱 matlab画,matlab窄带随机过程
  14. 真人踩过的坑,告诉你避免自动化测试常犯的10个错误
  15. IM 去中心化概念模型与架构设计
  16. c语言字符串函数strcat strcpy strlen strcmp的用法及原型
  17. python 判断大于等于且小于等于_关于if语句:检查python中值是否大于、小于或等于零的更好方法...
  18. 多米诺骨牌上演:三箭资本崩盘始末
  19. arm服务器还是x86架构的服务器,哪个稳定?
  20. VisualVM的配置和使用

热门文章

  1. 推荐一个好用的在线pdf压缩工具
  2. API网关之网关概述、技术选型
  3. python爬虫技术如何挣钱?教你爬虫月入三万
  4. 解决Win10任务栏图标消失
  5. 苹果手机如何一键备份手机里的照片和视频?
  6. dpdk pmd驱动初始化
  7. 卡方检验(Chi square statistic)
  8. 511遇见易语言学习易语言常量
  9. 设计师如何提高个人的色彩搭配能力?
  10. 笨方法学python 习题6