本文将主要讲解全连接神经网络的基本结构,包括对神经元、网络的输入 & 输出,权重w & 偏置b,激活函数的理解与符号约定。主要参考Neural Networks and Deep Learning这本书,非常适合初学者入门。

一、神经元—神经网络的组成单元

神经元模型的符号约定:输入:x⃗\vec{x}x,权重(weight):w⃗\vec{w}w,偏置(bias):bbb,未激活值:zzz,激活输出值:aaa
神经元可用于解决部分二分类问题——当有一个类别未知的x⃗\vec{x}x输入感知机,若输出值a = 1时,感知机被激活,代表_x_属于第一类;若输出值a = 0时,感知机未激活,则代表x属于第二类。而对于sigmoid神经元,若输出值a ≥ 0.5时,代表x属于第一类,否则为第二类。

二、sigmoid神经元的优势

不难看出,感知机可以轻松实现“与非”逻辑,而与非逻辑可以组合成其他任意的逻辑,但对于一些过于复杂的问题,我们难以写出其背后地逻辑结构。这时候神经网络就能大显身手:它可以自适应的学习规律,调节网络地权重和偏置等参数,我们只需要用大量的数据对其正确地训练,即可得到我们想要的效果!
那有一个很有意思的问题:相比于阶跃函数,为什么我们在神经网络中更愿意采用sigmoid函数作为激活函数呢?

首先,由于感知机的激活函数为阶跃函数(在0处突变),权重的一个小的变化就可能导致输出值的突变,而如果将激活函数替换为sigmoid函数,输出值的变化就能发生相应的小的变化,有利于网络学习;另外,由于采用二次代价函数作为损失函数时,利用BP算法求梯度值需要对冲激函数求导,sigmoid函数正好时连续可导的,而且导数很好求。

三、全连接神经网络结构

为了便于理解,先画一个三层的全连接神经网络示意图,激活函数都选用sigmoid函数。全连接神经网络指除输出层外,每一个神经元都与下一层中的各神经元相连接。网络的第一层为输入层,最后一层为输出层,中间的所有层统称为隐藏层。其中,输入层的神经元比较特殊,不含偏置bbb,也没有激活函数σ(⋅)\sigma(·)σ(⋅)。

神经网络结构的符号约定:wkjlw^l_ {kj}wkjl​代表第lll层的第kkk个神经元与第(l−1)(l-1)(l−1)层的第jjj个神经元连线上的权重;WlW^lWl代表第lll层与第l−1l-1l−1层之间的所有权重www构成的权重矩阵。bkl、zkl、aklb^l_ {k}、z^l_ {k}、a^l_ {k}bkl​、zkl​、akl​分别代表第lll层的第kkk个神经元对应的偏置、未激活值、激活值;b⃗l、z⃗l、a⃗l\vec{b}^l、\vec{z}^l、\vec{a}^lbl、zl、al则分别代表第lll层的所有偏置组成的列向量、所有未激活值组成的列向量以及所有激活值组成的列向量。

注意!wkjlw^l_ {kj}wkjl​的**上角标数字lll是连线右边的层的层数,而下角标数字kjkjkj**是先写连线右边的层中神经元所在的位置kkk,再写连线左边的层中神经元所在的位置jjj,此顺序是为了使W⋅x⃗W·\vec{x}W⋅x时无需转置,方便书写。

下面展示了一个手写体识别的三层全连接神经网络结构:

隐藏层的功能可以看作是各种特征检测器的组合:检测到相应特征时,相应的隐藏层神经元就会被激活,从而使输出层相应的神经元也被激活。

近期的更新计划是 1. 如何利用梯度下降算法求解损失函数的最小值(即网络的训练过程)、2. 如何利用BP反向误差传播算法优化梯度求解、3. 梯度下降算法的常见变种。后面也会更新一些BP网络、CNN网络源代码,欢迎关注,有不严谨之处请指正~

【深度学习原理】神经网络结构 符号约定相关推荐

  1. 【深度学习】神经网络结构搜索(NAS)与多模态

    [深度学习]神经网络结构搜索(NAS)与多模态 文章目录1 概述 2 经典的NAS方法2.1 搜索空间2.2 搜索策略2.3 性能评估 3 多模态 4 多模态表示学习 Multimodal Repre ...

  2. 神经网络和深度学习(4)--符号约定

    神经网络和深度学习 上一篇 主目录 下一篇 [前言] 这里会使用到很多的符号,各种符号代表不同的含义.为了方便查询,将符号的含义整理在这里. 注:X.shape可以查看矩阵X的维度 符号 含义 x 表 ...

  3. 深度学习原理-----循环神经网络(RNN、LSTM)

    系列文章目录 深度学习原理-----线性回归+梯度下降法 深度学习原理-----逻辑回归算法 深度学习原理-----全连接神经网络 深度学习原理-----卷积神经网络 深度学习原理-----循环神经网 ...

  4. 深度学习原理-----全连接神经网络

    系列文章目录 深度学习原理-----线性回归+梯度下降法 深度学习原理-----逻辑回归算法 深度学习原理-----全连接神经网络 深度学习原理-----卷积神经网络 深度学习原理-----循环神经网 ...

  5. 视频教程-深度学习原理详解及Python代码实现-深度学习

    深度学习原理详解及Python代码实现 大学教授,美国归国博士.博士生导师:人工智能公司专家顾问:长期从事人工智能.物联网.大数据研究:已发表学术论文100多篇,授权发明专利10多项 白勇 ¥88.0 ...

  6. 深度学习原理学习小结 - Self-Attention/Transformer

    文章目录 深度学习原理学习小结 - Self-Attention/Transformer Self-Attention基本原理 引入 核心概念 计算方法 Transformer基本原理 知识补充 编码 ...

  7. python神经网络原理pdf_《深度学习原理与 TensorFlow实践》高清完整PDF版 下载

    1.封面介绍 2.出版时间 2019年7月 3.推荐理由 本书介绍了深度学习原理与TensorFlow实践.着重讲述了当前学术界和工业界的深度学习核心知识:机器学习概论.神经网络.深度学习.着重讲述了 ...

  8. 深度学习原理与TensorFlow实践

    深度学习原理与TensorFlow实践 王琛,胡振邦,高杰 著 ISBN:9787121312984 包装:平装 开本:16开 用纸:胶版纸 正文语种:中文 出版社:电子工业出版社 出版时间:2017 ...

  9. DL:深度学习算法(神经网络模型集合)概览之《THE NEURAL NETWORK ZOO》的中文解释和感悟(六)

    DL:深度学习算法(神经网络模型集合)概览之<THE NEURAL NETWORK ZOO>的中文解释和感悟(六) 目录 DRN DNC NTM CN KN AN 相关文章 DL:深度学习 ...

最新文章

  1. Docker(二):Dockerfile 使用介绍
  2. 实验1 Windows汇编语言开发环境
  3. 解锁redis锁的正确姿势
  4. Java Map中那些巧妙的设计
  5. 7-135 二叉搜索树的2层结点统计
  6. 基于MHA+semi sync实现mysql数据库的高可用
  7. 执行一次怎么会写入两次数据_Java进阶知识:一文详解缓存Redis的持久化机制,新手看完也会用
  8. Office 365 机器人(Bot)开发入门
  9. vim python 代码提示_linux vim 编写代码python使用tab补全
  10. Singular Value Decomposition(SVD)--奇异值分解【转】
  11. php 表别名,MySQL和PHP – 不是唯一的表/别名
  12. fullCalendar:中文API
  13. 酷狗.kgtemp文件加密算法逆向
  14. 键盘fn键常亮(一直亮),解决办法
  15. 开发团队人员配备及工作分配
  16. iOS 仿微信语音输入动画
  17. matlab画gds图,Matlab GDS流程.doc
  18. 把内存中的数据传送到计算机硬盘称为,将内存中的数据传送到计算机硬盘的过程称为什么...
  19. IPC 通信 - IPC
  20. isbn书号权威查询,isbn图书查询,图书

热门文章

  1. 在vue中如何使用百度地图
  2. c语言实现数独游戏求解
  3. Wordpres,博客园,csdn博客添加StatCounter
  4. 浙江省厅交通数据中台 为“车路协同”提供后台支撑
  5. 作为码农 ,我们为什么要写作
  6. asp.net高级教程
  7. 第三周作业3——Bug Report
  8. GUN tar for windows Practice
  9. Ubuntu:无法解析域名; E: 仓库 “https://mirrors.tuna.tsinghua.edu.cn/ros2/ubuntu bionic Release” 没有 Release 文件
  10. 静默接口(Silent-interface)