在学习 深度学习的时候,会有不少的专业词语,有些专业词语中,有时很难分清楚。

在之前的文章中,我们常常提到训练集验证集,其中训练集用于算法模型的训练和学习、验证集是对训练模型进行评估。在模型验证集上,不能包含训练集的数据。 假设,我们使用ImageNet作为数据集,再从谷歌上搜索类似的同类的图片,有时候效果会很好,有可能是训练误差,而非泛化误差,因为很多ImageNet上的图片,也是谷歌搜索出来的。

训练误差

训练误差是指, 模型在训练数据集上计算得到的误差,即在训练集上训练完毕后在训练集本身上进行预测得到了错分率。

泛化误差

泛化误差是指, 模型应用在同样从原始样本的分布中抽取的无限多数据样本时,模型误差的期望,即训练集上没见过的数据的错分样本比率。

问题是,我们永远不能准确地计算出泛化误差。 这是因为无限多的数据样本是一个虚构的对象。 在实际中,我们只能通过将模型应用于一个独立的测试集来估计泛化误差, 该测试集由随机选取的、未曾在训练集中出现的数据样本构成。

举个栗子:
在 高中的时候,每到期末考试时,我都会整理和总结本学期和历年考试真题,做的题很多,尽管如此,在考试中,并不能保障每次都很考出好的成绩,因为我只是尝试死记硬背,如果考题正好在我的记忆中,我就会考出好成绩,反之,则很差, 在这种场景下,所有的错题应该叫训练误差。后来,我尝试通过做题,理清楚知识原理,在考试中,遇到没见过的题目,也能通过知识架构梳理出解题思路,该场景下再出错的题目应该叫泛化误差

本号更新很慢,平时也不更新,讲的很琐碎。只是不想让自己囫囵吞枣式学习。我慢慢写,各位老板慢慢看。

关注公众号,解锁更多深度学习内容。

深度学习之训练误差和泛化误差相关推荐

  1. 欠拟合、过拟合、训练误差与泛化误差与模型复杂度的关系

    文章目录 相关定义 欠拟合和过拟合 欠拟合原因 欠拟合解决方案 过拟合原因 过拟合解决方案 相关定义 训练误差: 模型在训练数据集上表现出的误差. 泛化误差: 模型在任意⼀个测试数据样本上表现出的误差 ...

  2. 训练误差和泛化误差分别是什么,如何区分?

     在我们学习机器学习或深度学习的时候,经常会遇见一些迷惑词汇,让人傻傻分不清,比如博主刚开始学习的时候,就没有太过于区分,导致一些地方弄混.  今天就让我带着大家一起区分一下训练误差和泛化误差吧~有什 ...

  3. 训练误差与泛化误差的说明

    1. 训练误差与泛化误差的定义 在机器学习中,评价一个模型"优劣"的最直观的数据就是模型的误差,其中误差又分为以下两种误差: - 训练误差(training error):模型在训 ...

  4. 深度学习的数学-卷积神经网络的误差反向传播

    文章目录 前言 正文 卷积神经网络中的关系式 卷积层 池化层 输出层 平方误差(损失函数) 梯度下降法 卷积层和输出层的神经单元误差(重点) 输出层的神经单元误差计算 输出层的神经单元与其权重偏置的关 ...

  5. 收藏 | PyTorch深度学习模型训练加速指南2021

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:作者:LORENZ KUHN 编译:ronghuaiyang ...

  6. 深度学习模型训练的结果及改进方法

    深度学习模型训练的结果及改进方法 模型在训练集上误差较大: 解决方法:1. 选择新的激活函数2. 使用自适应的学习率 在训练集上表现很好,但在测试集上表现很差(过拟合): 解决方法:1. 减少迭代次数 ...

  7. 笔记 | 百度飞浆AI达人创造营:深度学习模型训练和关键参数调优详解

    笔记 | 百度飞浆AI达人创造营:深度学习模型训练和关键参数调优详解 针对特定场景任务从模型选择.模型训练.超参优化.效果展示这四个方面进行模型开发. 一.模型选择 从任务类型出发,选择最合适的模型. ...

  8. 深度学习模型训练和关键参数调优详解

    深度学习模型训练和关键参数调优详解 一.模型选择 1.回归任务 人脸关键点检测 2.分类任务 图像分类 3.场景任务 目标检测 人像分割 文字识别 二.模型训练 1.基于高层API训练模型 加载数据集 ...

  9. 机器学习中的误差、经验误差、泛化误差

    误差:学习器的实际预测输出与样本的真实输出之间的差异称为"误差". 经验误差(训练误差):模型在训练集上的误差称为"经验误差"(empirical error) ...

  10. 深度学习如何训练出好的模型

    深度学习在近年来得到了广泛的应用,从图像识别.语音识别到自然语言处理等领域都有了卓越的表现.但是,要训练出一个高效准确的深度学习模型并不容易.不仅需要有高质量的数据.合适的模型和足够的计算资源,还需要 ...

最新文章

  1. todoist 无法登陆_通过构建Todoist克隆将您的React技能提升到一个新的水平
  2. pstree进程管理
  3. eclipse中将项目打包成jar的两种方法,及其问题与解决方法
  4. 对map集合进行排序
  5. 判断一颗二叉树是否是二叉排序树
  6. WORD单元格底部内容不见了怎么办?
  7. (转)关于做android+J2ee系统集成开发的一点心得
  8. 还没用上 JDK 11,12 就要来了
  9. 软件测试达内视频笔记(二)
  10. Python 筛法求素数
  11. 百度cdn几时能入币_汇率是怎么确定的,由谁确定的?
  12. RIME输入法配置双拼方案(Ubuntu下基于ibus)
  13. 高效能人士的七个习惯 读书笔记
  14. Visio绘制维恩图举例
  15. python中一切都是对象对吗_在 Python 中一切皆对象,它完全支持()
  16. pyalgotrade源码分析4--PyAlgoTrade统计指标
  17. 洛谷 P2708 硬币翻转 题解
  18. 滑模变结构控制理论及应用 [陈志梅 著] 2012年
  19. OOAD-设计模式(四)结构型模式之适配器、装饰器、代理模式
  20. Java Gui 项目打包成可执行的Jar包

热门文章

  1. Matlab矩阵操作
  2. 全“芯”赋能,SOM3568核心板
  3. 5G的网络切片功能概述
  4. php5.6安装php-gd,centos73下php5.6安装GD库
  5. 9.2 iptables主机防火墙
  6. 计算机数字键盘如何用,电脑小数字键盘不能使用的原因和解决方法
  7. 译:谷歌OKR指导手册(全文)
  8. python将经纬度坐标转换为xy_Python将x,y数据转换为经纬度d
  9. 程序员做外包有前途吗?
  10. 02-若依权限管理子系统简介(自己了解)