实现神经网络的时候,一个好的符号约定能够对繁多的样本数据和网络参数,神经网络的复杂计算等进行有条理地 组织表示

数据标记与上下标

  • x x x:表示输入数据,维度为 n x n_x nx​;
  • y y y:表示输出结果,维度(或者说类别数)为 n y n_y ny​;
  • 上标 ( i ) ^{(i)} (i)(小括号):代表第 i i i 个训练样本, x ( i ) x^{(i)} x(i) 和 x i x_i xi​ 存在混用的情况,注意识别;
  • ( x ( i ) , y ( i ) ) (x^{(i)},y^{(i)}) (x(i),y(i)):表示第 i i i 组数据,可能是训练数据,也可能是测试数据;
  • m m m:数据集的样本数。有时候为了强调,会使用 M t r a i n M_{train} Mtrain​ 表示训练集的样本数,用 M t e s t M_{test} Mtest​ 表示测试集的样本数;
  • 上标 [ l ] ^{[l]} [l](方括号):代表第 l l l 层
  • n h [ l ] n^{[l]}_h nh[l]​:代表第 l l l 层的隐藏单元数

模型参数

对神经网络进行编程时经常会让参数 w w w 和参数 b b b 分开,这里 w w w 表示 特征权重, b b b 对应 偏置。在其它的符号惯例中,有用 θ \theta θ 来统一表示模型参数的。

神经网络模型

为了能把训练集表示得更紧凑一点,我们会定义一个矩阵用大写 X X X 的表示,它由输入向量 x ( 1 ) x^{(1)} x(1)、 x ( 2 ) x^{(2)} x(2)等 按列堆叠 而成叠。所以这个矩阵有 m m m 列,是训练集的样本数量,然后这个矩阵的高度记为 n x n_x nx​,即 X.shape 为 ( n x , m ) (n_x,m) (nx​,m)。在实现神经网络的时候,使用按列堆叠的这种形式,会让整个实现的过程变得更加简单。

对于输出标签 y y y,我们同样按列堆叠,即 Y Y Y 等于 { y ( 1 ) , y ( 2 ) , . . . , y ( m ) } \{ y^{(1)},y^{(2)},...,y^{(m)}\} {y(1),y(2),...,y(m)},以便后续计算。Y.shape等于 ( 1 , m ) (1,m) (1,m)。

  • X ∈ R n x × m X\in\mathbb{R}^{n_x×m} X∈Rnx​×m:代表输入矩阵
  • x ( I ) ∈ R n x x^{(I)}\in\mathbb{R}^{n_x} x(I)∈Rnx​:代表第 i i i 个样本的列向量
  • Y ∈ R n y × m Y\in\mathbb{R}^{n_y×m} Y∈Rny​×m:代表标注矩阵
  • y ( i ) ∈ R n y y^{(i)}\in\mathbb{R}^{n_y} y(i)∈Rny​:代表第 i i i 个样本的标签
  • W [ l ] ∈ R n h [ l ] × n h [ l − 1 ] W^{[l]}\in\mathbb{R}^{n^{[l]}_h×n^{[l-1]}_h} W[l]∈Rnh[l]​×nh[l−1]​:代表第 l l l 层的权重矩阵
  • b [ l ] ∈ R n h [ l ] b^{[l]}\in\mathbb{R}^{n^{[l]}_h} b[l]∈Rnh[l]​:代表第 l l l 层的权重矩阵
  • y ^ \hat {y} y^​:表示模型预测输出向量

正向传播公式

损失函数

神经网络示意图

  • 节点:代表输入、激活或者输出
  • 边:代表权重或者误差

简单前馈网络


单个神经元

卷积神经网络


吴恩达 deeplearning.ai

【深度学习基础】深度学习符号定义(符号表示,符号惯例,符号约定)相关推荐

  1. [深度学习基础] 深度学习基础及数学原理

    图像分类 (image classification) 问题是指, 假设给定一系列离散的类别(categories)(如猫, 狗, 飞机, 货车, ...), 对于给定的图像, 从这些类别中赋予一个作 ...

  2. 深度学习基础论文学习

    轻量级网络 (一)MobileNet_v1--2017论文解读 (二)ShuffleNet_v1--2017论文解读 (三)MobileNet_v2--2018CVPR论文解读 (四)ShuffleN ...

  3. 1、(一)外汇学习基础篇之通用定义

    一.基础定义 1.外汇(Foreign Exchange / FX) 指以外币表示的可以用作国际清偿的支付手段和资产.本指引所指外汇为人民币以外的币种. [

  4. 总结1-深度学习-基础知识学习

    [小记]下采样和池化的区别:  池化的神解释: 池化 = 涨水 池化的过程 = 升高水位(扩大矩阵网格) 池化的目的是为了得到物体的边缘形状.可以想象水要了解山立体的形状,水位低时得出山脚的形状,水位 ...

  5. 计算机培训教案入门,计算机二级学习基础PPT学习教案.pptx

    文档介绍: 会计学 1 计算机二级学****基础 2 内容提要 算法:算法的基本概念.算法复杂度 数据结构的基本概念:什么是数据结构. 数据结构的图形表示. 线性结构与非线性结构 线性表及其顺序存储结 ...

  6. 对计算机知识的兴趣,大学新生计算机学习基础与兴趣的调查分析

    文章编号:1672-5913(2008)12-0029-04 摘要:本文根据大学计算机基础课程的教学目标和面临的情况,对大学新生的计算机基础知识和能力以及学习兴趣进行了调查,分析了调查结果,提出了相关 ...

  7. 深度学习基础 - 累加符号和连乘符号

    深度学习基础 - 累加符号和连乘符号 flyfish 累加符号 其他名字 Sigma Notation .Summation Notation 示例1 ∑i=15i=1+2+3+4+5\display ...

  8. 【深度学习基础】一步一步讲解卷积神经网络

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送 本文转自:一步一步讲解卷积神经网络 卷积神经网络(Convoluti ...

  9. 人工智能 - paddlepaddle飞桨 - 深度学习基础教程 - 编程指南

    编程指南 目前飞桨(PaddlePaddle,以下简称Paddle)已经同时支持动态图和静态图两种编程方式, 本文主要侧重于介绍静态图的编程方法,关于动态图编程方法,请参考动态图机制-DyGraph. ...

  10. 第三章_深度学习基础

    文章目录 第三章 深度学习基础 3.1 基本概念 3.1.1 神经网络组成? 3.1.2神经网络有哪些常用模型结构? 3.1.3如何选择深度学习开发平台? 3.1.4为什么使用深层表示? 3.1.5为 ...

最新文章

  1. SD卡的控制方法(指令集和控制时序)
  2. 剑指 Offer 43. 1~n整数中1出现的次数
  3. android c#websocket传送图片
  4. Mysql 5.7 报错 3534 错误
  5. ssh 三者集合的思想
  6. esp8266接收到的数据如何存放到数组中_java零基础——数组
  7. 通俗理解生成对抗网络GAN
  8. 计算机应用基础教案本中职,计算机应用基础教案:计算机概述(中职教育)
  9. Python-多进程
  10. 工程图样中粗实线的用途_图纸天天画,粗实线和细实线的线宽比例是多少?2:1还是3:1?...
  11. codeforces gym-101741 Elevator 动态规划、单调队列
  12. 『嗨威说』数据结构 - 第七章学习内容小结
  13. TCP网络通讯如何解决分包粘包问题
  14. Linear Mixde Model:线性混合模型简介
  15. 找回 Windows 11 丢失的扫雷游戏【新春快乐】
  16. 读懂SIEM建设?看这篇就够了!
  17. JME-java开发3D游戏
  18. Lucene高亮显示详解
  19. 薅资本主义羊毛新姿势,英伟达K80免费用
  20. XP的点滴(C语言)

热门文章

  1. 软件测试 | 测试开发 | Android 10 来袭
  2. Linux之rpm安装
  3. 16G的U盘 4G的压缩
  4. 士兵排队问题(拓补排序)(附简要拓补排序思想及算法)
  5. three.js 设置渲染帧数 FPS
  6. rownum使用方法
  7. 我的世界暮色森林java下载_我的世界暮色森林mod下载-我的世界暮色森林1.12.2下载-Minecraft中文分享站...
  8. [读书笔记]一本书学会人情世故
  9. Python openpyxl匹配单元格内容删除excel指定行
  10. java二维数组及遍历