各种误差:RMSE、MSE、MAE、SD

RMSE(Root Mean Square Error)均方根误差

衡量观测值与真实值之间的偏差。常用来作为机器学习模型预测结果衡量的标准。

MSE(Mean Square Error)均方误差

MSE是真实值与预测值的差值的平方然后求和平均。通过平方的形式便于求导,所以常被用作线性回归的损失函数。

MAE(Mean Absolute Error)平均绝对误差

是绝对误差的平均值。可以更好地反映预测值误差的实际情况。

SD(Standard Deviation)标准差

方差的算术平均根。用于衡量一组数值的离散程度。

Epoch,Batchsize,Iterations

在训练模型时,如果训练数据过多,无法一次性将所有数据送入计算,那么我们就会遇到epoch,batchsize,iterations这些概念。为了克服数据量多的问题,我们会选择将数据分成几个部分,即batch,进行训练,从而使得每个批次的数据量是可以负载的。将这些batch的数据逐一送入计算训练,更新神经网络的权值,使得网络收敛。

Epoch

一个epoch指代所有的数据送入网络中完成一次前向计算及反向传播的过程。由于一个epoch常常太大,计算机无法负荷,我们会将它分成几个较小的batches。那么,为什么我们需要多个epoch呢?我们都知道,在训练时,将所有数据迭代训练一次是不够的,需要反复多次才能拟合收敛。在实际训练时,我们将所有数据分成几个batch,每次送入一部分数据,梯度下降本身就是一个迭代过程,所以单个epoch更新权重是不够的。

可见,随着epoch数量的增加,神经网络中权重更新迭代的次数增多,曲线从最开始的不拟合状态,慢慢进入优化拟合状态,最终进入过拟合。

因此,epoch的个数是非常重要的。那么究竟设置为多少才合适呢?恐怕没有一个确切的答案。对于不同的数据库来说,epoch数量是不同的。但是,epoch大小与数据集的多样化程度有关,多样化程度越强,epoch应该越大。

Batch Size

所谓Batch就是每次送入网络中训练的一部分数据,而Batch Size就是每个batch中训练样本的数量。

上文提及,每次送入训练的不是所有数据而是一小部分数据,另外,batch size 和batch numbers不是同一个概念~

Batch size大小的选择也至关重要。为了在内存效率和内存容量之间寻求最佳平衡,batch size应该精心设置,从而最优化网络模型的性能及速度。

Iterations

所谓iterations就是完成一次epoch所需的batch个数。刚刚提到的,batch numbers就是iterations。简单一句话说就是,我们有2000个数据,分成4个batch,那么batch size就是500。运行所有的数据进行训练,完成1个epoch,需要进行4次iterations

卷积 conv 反卷积deconv/transposed conv

卷积

作用:提取局部区域内的特征

反卷积

实现信号复原,在全卷积网络(FCN)中,实现上采样。

参考:

RMSE(均方根误差)/MSE(均方误差)/MAE(平均绝对误差)/SD(标准差)https://blog.csdn.net/FrankieHello/article/details/82024526/

深度学习中的Epoch,Batchsize,Iterations,都是什么鬼?https://www.jianshu.com/p/e5076a56946c/

卷积和反卷积(deconv)的正向 https://blog.csdn.net/qq_31157393/article/details/82051319

深度学习笔记_术语/缩写/基本概念相关推荐

  1. HALCON 20.11:深度学习笔记(7)---术语表

    HALCON 20.11:深度学习笔记(7)---术语表 HALCON 20.11.0.0中,实现了深度学习方法.下面,我们将描述深度学习环境中使用的最重要的术语: anchor (锚) Anchor ...

  2. 深度学习笔记_毕设记录

    这篇文章用来汇总准备本科毕设过程中遇到的一些问题.参考资料等,会随时更新,因为是给自己当笔记看的,出发点是方便自己以后随时取阅,可能不会非常详尽.欢迎指正. 目录 深度学习相关的笔记 深度学习各种模型 ...

  3. HALCON 21.11:深度学习笔记---术语表(7)

    HALCON 21.11:深度学习笔记---术语表(7) HALCON 21.11.0.0中,实现了深度学习方法.下面,我们将描述深度学习环境中使用的最重要的术语: anchor (锚) Anchor ...

  4. 深度学习笔记:01快速构建一个手写数字识别系统以及张量的概念

    深度学习笔记:01快速构建一个手写数字识别系统 神经网络代码最好运行在GPU中,但是对于初学者来说运行在GPU上成本太高了,所以先运行在CPU中,就是慢一些. 一.安装keras框架 使用管理员模式打 ...

  5. 数字IC设计学习笔记_静态时序分析STA_ STA基本概念

    数字IC设计学习笔记 STA基本概念 1. STA基本概念 2. 时序弧概念 Timing Arc 3. 建立时间和保持时间概念 4. 时序路径概念Timing Path 5. 时钟域概念clock ...

  6. octave深度学习_【深度学习笔记】(一)Octave

    [深度学习笔记](一)Octave Octave是一种面向科学数学运算的原型语言,内置了强大的数学函数及图形展示工具.原型prototyping设计的意思是使用ovtave进行算法设计.实现.验证等过 ...

  7. 深度学习中epoch,batch的概念--笔记

    深度学习中epoch,batch的概念 batch.epoch和iteration是深度学习中几个常见的超参数. (1) batch_ size: 每批数据量的大小.DL通常用SGD的优化算法进行训练 ...

  8. 一文弄懂元学习 (Meta Learing)(附代码实战)《繁凡的深度学习笔记》第 15 章 元学习详解 (上)万字中文综述

    <繁凡的深度学习笔记>第 15 章 元学习详解 (上)万字中文综述(DL笔记整理系列) 3043331995@qq.com https://fanfansann.blog.csdn.net ...

  9. 深度学习笔记其五:卷积神经网络和PYTORCH

    深度学习笔记其五:卷积神经网络和PYTORCH 1. 从全连接层到卷积 1.1 不变性 1.2 多层感知机的限制 1.2.1 平移不变性 1.2.2 局部性 1.3 卷积 1.4 "沃尔多在 ...

  10. 深度学习笔记其三:多层感知机和PYTORCH

    深度学习笔记其三:多层感知机和PYTORCH 1. 多层感知机 1.1 隐藏层 1.1.1 线性模型可能会出错 1.1.2 在网络中加入隐藏层 1.1.3 从线性到非线性 1.1.4 通用近似定理 1 ...

最新文章

  1. centos 5.5 mysql 5.5.39_CentOS 5.5 下安装 Mysql 5.5
  2. 《Jersey用户指南》翻译邀请
  3. 阿里巴巴java规范检查_阿里巴巴Java开发规范
  4. 51 Nod 1670 打怪兽
  5. 解决xib自定义tableFooterView一个神奇的bug
  6. app运行租用服务器,app租用服务器
  7. 大数据之-Hadoop3.x_Hadoop_HDFS_掉线时限参数设置---大数据之hadoop3.x工作笔记0079
  8. Android模拟器图形绘原理(二十二)
  9. Git 操作实战示例
  10. 12306网上买火车票选择上中下铺的方法
  11. 台式计算机m.2的参数,联想启天M系列
  12. ping命令显示时间
  13. 德保罗大学计算机专业,2020年德保罗大学排名TFE Times美国最佳计算机科学硕士专业排名第75...
  14. 分布式、集中式存储与san、nas
  15. 这20种PS技术让你的照片美不胜收
  16. 《蛋白质和细胞》:人类合子中CHEK1基因杂合突变造成卵裂阻滞
  17. 使用VPS时的注意事项
  18. 归并排序-拓展至三路归并
  19. BIOS工程师需要掌握的知识
  20. Golang for循环

热门文章

  1. 在LoadRunner中设置HTTP请求time-out的时间
  2. EF6学习笔记十:原始查询,在EF中使用SQL语句
  3. DOM解析和SAX解析对比
  4. 20170813xlVBA跨表筛选数据
  5. Oracle-数据库
  6. iOS 修改状态栏颜色
  7. 根据IP地址获得地理位置
  8. marquee标签制作轮播图
  9. 使用强类型DataSet增加数据并获取自动增长的ID
  10. Activity传递数据