【深度学习基础】深度学习符号定义(符号表示,符号惯例,符号约定)
实现神经网络的时候,一个好的符号约定能够对繁多的样本数据和网络参数,神经网络的复杂计算等进行有条理地 组织 和 表示。
数据标记与上下标
- x x x:表示输入数据,维度为 n x n_x nx;
- y y y:表示输出结果,维度(或者说类别数)为 n y n_y ny;
- 上标 ( i ) ^{(i)} (i)(小括号):代表第 i i i 个训练样本, x ( i ) x^{(i)} x(i) 和 x i x_i xi 存在混用的情况,注意识别;
- ( x ( i ) , y ( i ) ) (x^{(i)},y^{(i)}) (x(i),y(i)):表示第 i i i 组数据,可能是训练数据,也可能是测试数据;
- m m m:数据集的样本数。有时候为了强调,会使用 M t r a i n M_{train} Mtrain 表示训练集的样本数,用 M t e s t M_{test} Mtest 表示测试集的样本数;
- 上标 [ l ] ^{[l]} [l](方括号):代表第 l l l 层
- n h [ l ] n^{[l]}_h nh[l]:代表第 l l l 层的隐藏单元数
模型参数
对神经网络进行编程时经常会让参数 w w w 和参数 b b b 分开,这里 w w w 表示 特征权重, b b b 对应 偏置。在其它的符号惯例中,有用 θ \theta θ 来统一表示模型参数的。
神经网络模型
为了能把训练集表示得更紧凑一点,我们会定义一个矩阵用大写 X X X 的表示,它由输入向量 x ( 1 ) x^{(1)} x(1)、 x ( 2 ) x^{(2)} x(2)等 按列堆叠 而成叠。所以这个矩阵有 m m m 列,是训练集的样本数量,然后这个矩阵的高度记为 n x n_x nx,即 X.shape
为 ( n x , m ) (n_x,m) (nx,m)。在实现神经网络的时候,使用按列堆叠的这种形式,会让整个实现的过程变得更加简单。
对于输出标签 y y y,我们同样按列堆叠,即 Y Y Y 等于 { y ( 1 ) , y ( 2 ) , . . . , y ( m ) } \{ y^{(1)},y^{(2)},...,y^{(m)}\} {y(1),y(2),...,y(m)},以便后续计算。Y.shape
等于 ( 1 , m ) (1,m) (1,m)。
- X ∈ R n x × m X\in\mathbb{R}^{n_x×m} X∈Rnx×m:代表输入矩阵
- x ( I ) ∈ R n x x^{(I)}\in\mathbb{R}^{n_x} x(I)∈Rnx:代表第 i i i 个样本的列向量
- Y ∈ R n y × m Y\in\mathbb{R}^{n_y×m} Y∈Rny×m:代表标注矩阵
- y ( i ) ∈ R n y y^{(i)}\in\mathbb{R}^{n_y} y(i)∈Rny:代表第 i i i 个样本的标签
- W [ l ] ∈ R n h [ l ] × n h [ l − 1 ] W^{[l]}\in\mathbb{R}^{n^{[l]}_h×n^{[l-1]}_h} W[l]∈Rnh[l]×nh[l−1]:代表第 l l l 层的权重矩阵
- b [ l ] ∈ R n h [ l ] b^{[l]}\in\mathbb{R}^{n^{[l]}_h} b[l]∈Rnh[l]:代表第 l l l 层的权重矩阵
- y ^ \hat {y} y^:表示模型预测输出向量
正向传播公式
损失函数
神经网络示意图
- 节点:代表输入、激活或者输出
- 边:代表权重或者误差
简单前馈网络
单个神经元
卷积神经网络
吴恩达 deeplearning.ai
【深度学习基础】深度学习符号定义(符号表示,符号惯例,符号约定)相关推荐
- [深度学习基础] 深度学习基础及数学原理
图像分类 (image classification) 问题是指, 假设给定一系列离散的类别(categories)(如猫, 狗, 飞机, 货车, ...), 对于给定的图像, 从这些类别中赋予一个作 ...
- 深度学习基础论文学习
轻量级网络 (一)MobileNet_v1--2017论文解读 (二)ShuffleNet_v1--2017论文解读 (三)MobileNet_v2--2018CVPR论文解读 (四)ShuffleN ...
- 1、(一)外汇学习基础篇之通用定义
一.基础定义 1.外汇(Foreign Exchange / FX) 指以外币表示的可以用作国际清偿的支付手段和资产.本指引所指外汇为人民币以外的币种. [
- 总结1-深度学习-基础知识学习
[小记]下采样和池化的区别: 池化的神解释: 池化 = 涨水 池化的过程 = 升高水位(扩大矩阵网格) 池化的目的是为了得到物体的边缘形状.可以想象水要了解山立体的形状,水位低时得出山脚的形状,水位 ...
- 计算机培训教案入门,计算机二级学习基础PPT学习教案.pptx
文档介绍: 会计学 1 计算机二级学****基础 2 内容提要 算法:算法的基本概念.算法复杂度 数据结构的基本概念:什么是数据结构. 数据结构的图形表示. 线性结构与非线性结构 线性表及其顺序存储结 ...
- 对计算机知识的兴趣,大学新生计算机学习基础与兴趣的调查分析
文章编号:1672-5913(2008)12-0029-04 摘要:本文根据大学计算机基础课程的教学目标和面临的情况,对大学新生的计算机基础知识和能力以及学习兴趣进行了调查,分析了调查结果,提出了相关 ...
- 深度学习基础 - 累加符号和连乘符号
深度学习基础 - 累加符号和连乘符号 flyfish 累加符号 其他名字 Sigma Notation .Summation Notation 示例1 ∑i=15i=1+2+3+4+5\display ...
- 【深度学习基础】一步一步讲解卷积神经网络
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送 本文转自:一步一步讲解卷积神经网络 卷积神经网络(Convoluti ...
- 人工智能 - paddlepaddle飞桨 - 深度学习基础教程 - 编程指南
编程指南 目前飞桨(PaddlePaddle,以下简称Paddle)已经同时支持动态图和静态图两种编程方式, 本文主要侧重于介绍静态图的编程方法,关于动态图编程方法,请参考动态图机制-DyGraph. ...
- 第三章_深度学习基础
文章目录 第三章 深度学习基础 3.1 基本概念 3.1.1 神经网络组成? 3.1.2神经网络有哪些常用模型结构? 3.1.3如何选择深度学习开发平台? 3.1.4为什么使用深层表示? 3.1.5为 ...
最新文章
- SD卡的控制方法(指令集和控制时序)
- 剑指 Offer 43. 1~n整数中1出现的次数
- android c#websocket传送图片
- Mysql 5.7 报错 3534 错误
- ssh 三者集合的思想
- esp8266接收到的数据如何存放到数组中_java零基础——数组
- 通俗理解生成对抗网络GAN
- 计算机应用基础教案本中职,计算机应用基础教案:计算机概述(中职教育)
- Python-多进程
- 工程图样中粗实线的用途_图纸天天画,粗实线和细实线的线宽比例是多少?2:1还是3:1?...
- codeforces gym-101741 Elevator 动态规划、单调队列
- 『嗨威说』数据结构 - 第七章学习内容小结
- TCP网络通讯如何解决分包粘包问题
- Linear Mixde Model:线性混合模型简介
- 找回 Windows 11 丢失的扫雷游戏【新春快乐】
- 读懂SIEM建设?看这篇就够了!
- JME-java开发3D游戏
- Lucene高亮显示详解
- 薅资本主义羊毛新姿势,英伟达K80免费用
- XP的点滴(C语言)
热门文章
- 软件测试 | 测试开发 | Android 10 来袭
- Linux之rpm安装
- 16G的U盘 4G的压缩
- 士兵排队问题(拓补排序)(附简要拓补排序思想及算法)
- three.js 设置渲染帧数 FPS
- rownum使用方法
- 我的世界暮色森林java下载_我的世界暮色森林mod下载-我的世界暮色森林1.12.2下载-Minecraft中文分享站...
- [读书笔记]一本书学会人情世故
- Python openpyxl匹配单元格内容删除excel指定行
- java二维数组及遍历