当神经元结构的输出为所有输入的加权和,那么神经网络是一个线性模型。如果将每一个神经元(神经网络节点),的输出通过一个非线性函数,那么整个神经网络的模型也就不再是线性的了。这个非线性函数就是激活函数。
下图为加入了激活函数和偏置项后的神经元结构:

神经网络结构加上激活函数和偏置项后的前向传播算法的数学定义为:

相比于传统的神经网络主要有两个改变:
第一是增加了偏置项(bias),偏置项是神经网络中非常常用的一种结构。
第二是每个节点的取值不再是单纯的加权和。每个节点的输出在加权和的基础上还做了一个非线性变换。
以下是几种常用的非线性激活函数的函数图像:

ReLu函数基本代替了sigmoid函数了,因为sigmoid函数很容易引起梯度消失,导致过拟合。
这些激活函数图像都不是一条直线,所以通过这些激活函数,每一个节点不再是线性变换,于是整个神经网络就不再是线性的了。

下图是加入了偏置项和ReLu激活函数之后的神经网络结构:

偏置项被设置为一个输出永远为1的节点(通常设置为1或者0,一般为常数项)。
新的神经网络模型前向传播算法的计算方法为:
隐藏层:

输出层:

目前Tensorflow提供了七种不同的非线性激活函数,tf.nnrelu、tf.sigmoid、tf.tanh是比较常用的几个。当然,Tensorflow也支持使用自己定义的激活函数。

深层神经网络——激活函数去线性化相关推荐

  1. ApacheCN《Sklearn 与 TensorFlow 机器学习实用指南》 第11章 项目训练深层神经网络(梯度消失与梯度爆炸,选择初始化,选择激活函数)

    原文:https://www.jishux.com/p/52b468ceb5722ca5 第11章 训练深层神经网络 来源:ApacheCN<Sklearn 与 TensorFlow 机器学习实 ...

  2. 深层神经网络和批归一化操作、selu激活函数、dropout

    深层神经网络其实对比之前的分类模型,他的网络层数更深,层数更多,但是,有时候也会造成过拟合的风险因为参数过多,导致全部拟合完容易记住样本. model = keras.models.Sequentia ...

  3. 【TensorFlow】笔记2:深层神经网络

    一.深度学习 vs 深层神经网络 深度学习:一类通过多层非线性变换对高复杂性数据建模算法的集合. 1.激活函数 线性模型的最大特点:任意线性模型的组合仍是线性模型,能够解决的问题也是有限的,这就是线性 ...

  4. TensorFlow:实战Google深度学习框架(三)深层神经网络

    第四章 深层神经网络 4.1 深度学习与深层神经网络 4.1.1 线性模型的局限性 4.1.2 激活函数实现非线性化 4.1.3 多层网络解决异或问题 4.2 损失函数 4.2.1 经典损失函数 1. ...

  5. TensorFlow学习笔记——深层神经网络

    引言 TensorFlow 版本1.15pip3 install tensorflow==1.15.0. 这是<TensorFlow实战Google深度学习框架(第2版)>的学习笔记,所有 ...

  6. 人工智能:深层神经网络

    为什么使用深层网络 对于人脸识别等应用,神经网络的第一层从原始图片中提取人脸的轮廓和边缘,每个神经元学习到不同边缘的信息:网络的第二层将第一层学得的边缘信息组合起来,形成人脸的一些局部的特征,例如眼睛 ...

  7. 深层神经网络与优化算法

    深层神经网络与优化算法 为什么使用深层网络 对于人脸识别等应用,神经网络的第一层从原始图片中提取人脸的轮廓和边缘,每个神经元学习到不同边缘的信息:网络的第二层将第一层学得的边缘信息组合起来,形成人脸的 ...

  8. 4.5 搭建深层神经网络块-深度学习-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 4.4 为什么使用深层表示 回到目录 4.6 前向和反向传播 搭建深层神经网络块 (Building Blocks of Deep Neural Networks) 这周的前 ...

  9. 4.1 深层神经网络-深度学习-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 3.12 总结习题 回到目录 4.2 深层网络中的前向传播 深层神经网络 (Deep L-layer Neural Network) 目前为止我们学习了只有一个单独隐藏层的神 ...

最新文章

  1. Qt调用MATLAB
  2. 微型计算机中的外存储器 现在普遍采用,2010澳门特别行政区全国计算机等级考试二级笔试试卷VB最新考试试题库(完整版)...
  3. 什么Linux服务器最适合你?
  4. http://www.cnblogs.com/Javame/p/3632473.html
  5. 【转】Spring 的下载、安装和使用
  6. linux_unix编程手册-信号概述signal函数
  7. 远程访问ubuntu下mysql的问题
  8. qimage加载bmp图片_批量修改图片大小,我发现了最简单的方法!
  9. java 实现websocket的两种方式
  10. vtigerCrm 目录结构(整理中)
  11. UESTC 31 饭卡 card
  12. 腾讯前端面试题:一言不合就写个五子棋
  13. hibernate使用sql语句查询实体时,要写上addEntity
  14. pycharm pip超时 无法下载package 更换源
  15. 山东计算机考研909,山东大学2018年计算机考研909数据结构考试大纲
  16. unity教程之Unity引擎
  17. android 网易新闻 登录界面,Android实现仿网易新闻主界面设计
  18. mac打开airplay(隔空播放)
  19. flutter onPressed onTap等手势检测及触摸事件处理
  20. php删除帖子代码,删帖 - iptv信源、网络视频直播ip资源、直播代码 - 恩山无线论坛 - Powered by Discuz!...

热门文章

  1. 大数据入门(一)-大数据概念和特点(1)
  2. php refcount,php的函数的形参refcount为何要加2
  3. mysql8基本操作
  4. bash 历史记录_这些提示使Bash历史记录更加有用
  5. Hacktoberfest活动导致GitHub捐款近5万
  6. (6)css常用样式属性--文字样式
  7. Eclipse设置server Locations及getServletContext().getRealPath获取到的工程目录路径
  8. MySql | 为什么大家都在说 Select * 效率低
  9. 修复IE下列表 li 底部空行Bug
  10. es6 WeakMap