转载知乎答主:颜沁睿
原回答链接:神经网络激活函数的作用和原理?

以下为原文:

这是一个单层的感知机, 也是我们最常用的神经网络组成单元啦. 用它可以划出一条线, 把平面分割开

那么很容易地我们就会想用多个感知机来进行组合, 获得更强的分类能力, 这是没问题的啦~
如图所示:

那么我们动笔算一算, 就可以发现, 这样一个神经网络组合起来,输出的时候无论如何都还是一个线性方程哎~
纳尼, 说好的非线性分类呢???

再盗用一幅经常在课堂上用的图…然而我已经不知道出处是哪了, 好像好多老师都是直接用的, 那我就不客气了嘿嘿嘿
这幅图就跟前面的图一样, 描述了当我们直接使用step activation function的时候所能获得的分类器, 其实只能还是线性的, 最多不过是复杂的线性组合罢了~
当然你可以说我们可以用无限条直线去逼近一条曲线啊…额,当然可以, 不过比起用non-linear的activation function来说就太傻了嘛…


题主问的激励函数作用是什么, 就在这里了!!
我们在每一层叠加完了以后, 加一个激活函数, 如图中的y=σ(a)y=\sigma (a)y=σ(a). 这样输出的就是一个不折不扣的非线性函数!

于是就很容易拓展到多层的情况啦, 更刚刚一样的结构, 加上non-linear activation function之后, 输出就变成了一个复杂的, 复杂的, 超级复杂的函数…额别问我他会长成什么样, 没人知道的~
我们只能说, 有了这样的非线性激活函数以后, 神经网络的表达能力更加强大了(比起纯线性组合, 那是必须得啊!)

继续厚颜无耻地放一张跟之前那副图并列的图, 加上非线性激活函数之后, 我们就有可能学习到这样的平滑分类平面. 这个比刚刚那个看起来牛逼多了有木有!

机器学习:激活函数的作用和原理相关推荐

  1. 线性方程组数学原理、矩阵原理及矩阵变换本质、机器学习模型参数求解相关原理讨论...

    1. 线性方程组 0x1:无处不在的线性方程组 日常生活或生产实际中经常需要求一些量,用未知数 x1,x2,....,xn表示这些量,根据问题的实际情况列出方程组,而最常见的就是线性方程组(当然并不是 ...

  2. Batch Normalization的作用及原理

    目录 声明 BN是什么[1] 为什么提出BN[1, 2] BN的作用及原理 加速训练,提高收敛速度[1] 缓解梯度消失(梯度爆炸)[3] 缓解过拟合[4] 其他相关问题 BN和激活函数的顺序问题[5] ...

  3. 图机器学习(GML)图神经网络(GNN)原理和代码实现(前置学习系列二)

    图机器学习(GML)&图神经网络(GNN)原理和代码实现(PGL)[前置学习系列二] 上一个项目对图相关基础知识进行了详细讲述,下面进图GML networkx :NetworkX 是一个 P ...

  4. 第3.1章 卷积神经网络(CNN)——Conv、Pool、FC、Activation Function、BN各个层的作用及原理

    第3.1章 卷积神经网络CNN-不同层的作用 一.Convolution(CONV) 二.Pooling(POOL) 三.Fully Connected(FC) 四.Activation Functi ...

  5. Python大数据综合应用 :零基础入门机器学习、深度学习算法原理与案例

    机器学习.深度学习算法原理与案例实现暨Python大数据综合应用高级研修班 一.课程简介 课程强调动手操作:内容以代码落地为主,以理论讲解为根,以公式推导为辅.共4天8节,讲解机器学习和深度学习的模型 ...

  6. A.图机器学习(GML)图神经网络(GNN)原理和代码实现(前置学习系列二)

    图学习图神经网络算法专栏简介:主要实现图游走模型(DeepWalk.node2vec):图神经网络算法(GCN.GAT.GraphSage),部分进阶 GNN 模型(UniMP标签传播.ERNIESa ...

  7. 激活函数、Sigmoid激活函数、tanh激活函数、ReLU激活函数、Leaky ReLU激活函数、Parametric ReLU激活函数详细介绍及其原理详解

    相关文章 梯度下降算法.随机梯度下降算法.动量随机梯度下降算法.AdaGrad算法.RMSProp算法.Adam算法详细介绍及其原理详解 反向传播算法和计算图详细介绍及其原理详解 激活函数.Sigmo ...

  8. volatile关键字的作用、原理

    在只有双重检查锁,没有volatile的懒加载单例模式中,由于指令重排序的问题,我确实不会拿到两个不同的单例了,但我会拿到"半个"单例. 而发挥神奇作用的volatile,可以当之 ...

  9. Bundler 的作用及原理

    Bundler 的作用及原理 翻译 · yesmeck · Created at one year ago · Last by teacafe2000 Replied at one year ago  ...

  10. JAVA基础加强(张孝祥)_类加载器、分析代理类的作用与原理及AOP概念、分析JVM动态生成的类、实现类似Spring的可配置的AOP框架...

    1.类加载器 ·简要介绍什么是类加载器,和类加载器的作用 ·Java虚拟机中可以安装多个类加载器,系统默认三个主要类加载器,每个类负责加载特定位置的类:BootStrap,ExtClassLoader ...

最新文章

  1. TF-IDF 原理及sklearn中的tf-idf实例分析
  2. 特征选择过滤法之方差选择、双样本t检验、方差分析、相关系数法、卡方检验、互信息法
  3. 【iOS UIKit】UITableView属性及方法大全
  4. Application ProvidedAar 完结篇
  5. manjaro文件不是一个有效的图表主题_重磅分享-揭开Excel动态交互式图表神秘面纱...
  6. python matplotlib图中插入表格
  7. Linux进程优先级取值范围,Linux中使用nice和renice命令:改变进程优先级
  8. c 是高级程序设计语言吗,下列各类计算机程序语言中,不属于高级程序设计语言的是()。A.Visual BasicB.FORTRAN语言C.Pasca...
  9. 自动化学科前沿讲座分享,作业,自动化与人工智能
  10. java 零拷贝_牛逼哄哄的零拷贝是什么?
  11. word ppt中设置TAB缩进量
  12. 似然函数以及最大似然估计
  13. Kotlin use函数的魔法
  14. 新视野|大数据时代的信息安全
  15. 计算机硬件报警声音,有关电脑发出警报声的.
  16. pc端手机短信发送的介绍
  17. [野狐行][内存辅助][二重门更新中][2016/6/1]
  18. 关于用d3.js画力导向图(Force-directed Graph)—如何让图收放自如
  19. 三天打鱼两天晒网的c语言程序,回归经典之C语言《三天打鱼两天晒网》
  20. 关于山寨版istream_iterator的实现……

热门文章

  1. Flask 扩展 自定义扩展
  2. Unix编程之size_t、ssize_t
  3. [AaronYang]C#人爱学不学[2]
  4. 【不积跬步,无以致千里】五个常用的Linux监控脚本代码
  5. Apache创建虚拟目录绑定域名
  6. asp.net连接mssql server的方式
  7. Myeclipse破解后报错解决
  8. 小猿圈之测试用例的八大要素
  9. 书海拾贝|开发艺术探索之 android 的消息机制
  10. Python+selenium自动化 - 环境搭建