作者:颜沁睿
链接:https://www.zhihu.com/question/22334626/answer/103835591
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

我觉得

@lee philip

的答案呢主要是在说为什么需要用非线性函数来进行分类, 而没有点出为什么没有activation function就不能非线性分类. 于是乎祭出我上次用的几幅图吧~~~
----------------------------------
这是一个单层的感知机, 也是我们最常用的神经网络组成单元啦. 用它可以划出一条线, 把平面分割开
<img src="https://pic4.zhimg.com/50/2e83b4403f21654cd9147f13ecfaf799_hd.jpg" data-rawwidth="884" data-rawheight="460" class="origin_image zh-lightbox-thumb" width="884" data-original="https://pic4.zhimg.com/2e83b4403f21654cd9147f13ecfaf799_r.jpg">
那么很容易地我们就会想用多个感知机来进行组合, 获得更强的分类能力, 这是没问题的啦~~~~
如图所示,
<img src="https://pic3.zhimg.com/50/ef7eb0f56730058e1100dd6605eb2a25_hd.jpg" data-rawwidth="880" data-rawheight="459" class="origin_image zh-lightbox-thumb" width="880" data-original="https://pic3.zhimg.com/ef7eb0f56730058e1100dd6605eb2a25_r.jpg"> 那么我们动笔算一算, 就可以发现, 这样一个神经网络组合起来,输出的时候无论如何都还是一个线性方程哎~~~~纳尼, 说好的非线性分类呢~~~!!!!???
<img src="https://pic4.zhimg.com/50/7c6e12aed30bf315eed8df6476d7ef7b_hd.jpg" data-rawwidth="890" data-rawheight="409" class="origin_image zh-lightbox-thumb" width="890" data-original="https://pic4.zhimg.com/7c6e12aed30bf315eed8df6476d7ef7b_r.jpg"> 再盗用一幅经常在课堂上用的图...然而我已经不知道出处是哪了, 好像好多老师都是直接用的, 那我就不客气了嘿嘿嘿~~这幅图就跟前面的图一样, 描述了当我们直接使用step activation function的时候所能获得的分类器, 其实只能还是线性的, 最多不过是复杂的线性组合罢了~~~当然你可以说我们可以用无限条直线去逼近一条曲线啊......额,当然可以, 不过比起用non-linear的activation function来说就太傻了嘛....
<img src="https://pic3.zhimg.com/50/c46188f6f517a15142133129e47d1ae8_hd.jpg" data-rawwidth="643" data-rawheight="298" class="origin_image zh-lightbox-thumb" width="643" data-original="https://pic3.zhimg.com/c46188f6f517a15142133129e47d1ae8_r.jpg">

祭出主菜. 题主问的激励函数作用是什么, 就在这里了!!
我们在每一层叠加完了以后, 加一个激活函数, 如图中的. 这样输出的就是一个不折不扣的非线性函数!

<img src="https://pic1.zhimg.com/50/32cbeac5eaea9d655b9a50e4d8d0a687_hd.jpg" data-rawwidth="886" data-rawheight="486" class="origin_image zh-lightbox-thumb" width="886" data-original="https://pic1.zhimg.com/32cbeac5eaea9d655b9a50e4d8d0a687_r.jpg"> 于是就很容易拓展到多层的情况啦, 更刚刚一样的结构, 加上non-linear activation function之后, 输出就变成了一个复杂的, 复杂的, 超级复杂的函数....额别问我他会长成什么样, 没人知道的~~~~我们只能说, 有了这样的非线性激活函数以后, 神经网络的表达能力更加强大了~~(比起纯线性组合, 那是必须得啊!)
<img src="https://pic3.zhimg.com/50/3e4d3aabb90f51f467437a17861d3bf7_hd.jpg" data-rawwidth="923" data-rawheight="453" class="origin_image zh-lightbox-thumb" width="923" data-original="https://pic3.zhimg.com/3e4d3aabb90f51f467437a17861d3bf7_r.jpg"> 继续厚颜无耻地放一张跟之前那副图并列的图, 加上非线性激活函数之后, 我们就有可能学习到这样的平滑分类平面. 这个比刚刚那个看起来牛逼多了有木有!
<img src="https://pic3.zhimg.com/50/fab8a7ae1cb63992f70e160d7f03c067_hd.jpg" data-rawwidth="657" data-rawheight="331" class="origin_image zh-lightbox-thumb" width="657" data-original="https://pic3.zhimg.com/fab8a7ae1cb63992f70e160d7f03c067_r.jpg">

什么是激活函数以及其作用相关推荐

  1. 深度学习(四)——RNN, LSTM, 神经元激活函数进阶

    https://antkillerfarm.github.io/ 词向量 word2vec/doc2vec的缺点(续) 2.虽然我们一般使用word2vec/doc2vec来比较文本相似度,但是从原理 ...

  2. 深度学习基础(二)激活函数

    激活函数(也被称为激励函数)的意义就是加入非线性因素,使得神经网络具有非线性表达的能力.其必要条件是激活函数的输入和输出都是可微的,因为神经网络要求处处可微.(可微是指函数的各个方向可导,可微大于等于 ...

  3. 深度学习-为什么用激活函数

    激活函数 激活函数是什么? 激活函数有什么用 非线性因素解决什么问题 参考资料 激活函数是什么? 激活函数的主要作用是提供网络的非线性建模能力.如果没有激活函数,那么该网络仅能够表达线性映射,此时即便 ...

  4. 神经网络各个部分的作用 彻底理解神经网络

    这些题目来自知识星球[CV技术指南(免费版)]的日常作业 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结.最新技术跟踪.经典论文解读.CV招聘信息. 1. 神经网络的层数是如何数的? 我们说的 ...

  5. 神经网络常用激活函数及其应用举例

    神经网络中数据从数据层到最后输出层的流动过程其实就是数据从一种形态到另一种形态,从一个维度到另一个维度的变换过程,例如在Minst数据集训练中,就是把28*28维的图像数据经过变换,映射成0~9之间的 ...

  6. 常用激活函数(relu,glu,gelu,swish等)

    文章目录 sigmoid Tanh Relu leaky relu PRelu ELU GLU/GTU gelu swish 激活函数使用原则 激活函数的主要作用是提供网络的非线性建模能力. 本文简要 ...

  7. BP神经网络隐藏层的作用,bp神经网络输出层函数

    matlab bp神经网络只能输入一组预测一组吗 可以用前面很多数据建立网络后预测下几组数据吗 当然可以,这就是输入模式和输出模式的制定,可以自由设置,多输入多输出.但要注意如果预测多组,输入必须要提 ...

  8. 深度学习:神经网络中的激活函数

    http://blog.csdn.net/pipisorry/article/details/71157037 激活函数 神经网络神经元中,输入的 inputs 通过加权,求和后,还被作用了一个函数, ...

  9. (Tensorflow之四)激活函数、交叉熵及优化器

    一.激活函数 激活函数的主要作用是提供网络的非线性建模能力.如果没有激活函数,那么该网络仅能够表达线性映射,此时即便有再多的隐藏层,其整个网络跟单层神经网络也是等价的.因此也可以认为,只有加入了激活函 ...

最新文章

  1. matlab 多个表数据相加,Excel合并计算完成多表格数据汇总求和
  2. 比尔盖茨NEJM发文:新冠肺炎是百年一遇的流行病!全世界应该如何应对?
  3. spring与memcache的集成
  4. 万字长文深入理解java中的集合-附PDF下载
  5. MyBlog前端开发
  6. MyBatis 处理长字段(long varchar)
  7. delphi 读取pdf
  8. 在html语言中读取txt文件中的内容,Javascript写入txt和读取txt文件示例详解
  9. 互联网巨头们为什么钟爱咖啡?
  10. [转载]样式表编写效率手册 [ 日期:2004-10-15 ] [ 来自:Plod ]
  11. 2022-2028全球与中国呼吸系统疾病治疗市场现状及未来发展趋势
  12. 企业该如何用短信推广
  13. HTML转义字符、Javascript转义字符、HTML特殊字符对照表
  14. 【MATLAB教程案例7】基于Gardner环的定时误差检测matlab仿真
  15. 关于近期很火的视频解析APP
  16. ecshop2.5软件的文件架构{转}
  17. Geoserver基础配图研究
  18. ubuntu下搜狗输入法的乱码或者中英文切换异常解决办法
  19. 【老达人吐血整理】800种绘本的小达人点读包下载
  20. 2017-2018-2 20155314《网络对抗技术》Exp5 MSF基础应用

热门文章

  1. JAVA 网络聊天程序设计与实现(附关键代码) 可群聊私聊发送图片
  2. MySQL系列----创建函数
  3. 计算机专业jsp项目,可练手
  4. px、pt和em的区别
  5. Siemens Simcenter FloEFD 2021.2.0 for Catia V5
  6. JAVAweb开发学习
  7. 九章量子计算机应用,“九章”量子计算机这么牛,到底有什么用? |【经纬低调分享】...
  8. 广义表的长度和深度计算
  9. 《ESP32》Adafruit_GFX、u8g2驱动ssd1306
  10. ARM体系架构—ARMv7-A指令集:协处理器指令