前言

拟合从数学图像角度来说就是将一组平面图像上的点用平滑的曲线连接起来。

在深度学习中平面图像上的点就是数据特征(验证集样本特征值),然后用线将已经学到的数据特征连接起来,这样才称为拟合。

拟合也分三种:正确拟合、欠拟合、过拟合。

正确拟合

正确拟合是将样本特征学习的非常平滑,也就是学习到的样本与验证样本特征差距不大,经过算法学习样本特征值与验证集样本特征值差距并不大

如下图是一个正确拟合的数据曲线图:

从上图中可以看到有许多的方块点,然后用曲线将每个原点按顺序连接在一起,但是你可以看到曲线并不是完全从点上连接过来,而是靠近点的范围内画出一条线,这代表是算法提取特征出来的结果,这一点也能看出loss损失函数目前的收敛程度,可能一开始训练时的拟合图并不是很靠近点,但是在逐渐的训练过程中生成的拟合图逐渐将点靠近代表着loss损失与精确率逐渐提升,因为机器学习识别出来的特征与样本特征逐渐靠近。

因为验证集特征仅仅只是用于验证的,并不是实际学习的样本,所以线点理应在验证集样本点的附近,这样才证明你学习出来的特征与验证样本特征相差不大,说明验证集样本在与特征进行比较时正确率较高,线点就是学习特征与验证集特征的差值,这些线点连接在一起形成一个线条。

从上图可以看到曲线是非常平滑的,这种拟合的曲线叫正确拟合。

欠拟合

欠拟合就更好理解了,就是当前学习到的样本特征与验证集样本特征相差过大,如下图:

可以看到有非常多的代表验证集样本特征的方块,可以看到线条直线冲到了最后,有许多验证集样本特征附近没有出现线条,这意味着仅仅有一小部分的验证集样本被正确验证了,有许多验证集样本在验证时不合格的,如果验证集样本里有一些在进行验证时不合格的,那么生成的拟合图中就不会在那块验证集样本特征附近绘制线点,这个现象就说明学习的样本特征不能描述某些验证集特征,这种情况一般是你学习样本特征过少了,导致学习的样本不能描述所有验证集特征。

过拟合

最开始说正确拟合时说过,线点生成最好的条件是在验证集特征点附近,而不是完全重叠在研究者特征点上,这里说一下为什么,如下这张图是一张过拟合的曲线图:

可以看到与验证集特征点完全重叠了, 这种情况是因为机器学习时学习样本特征过多,大家要知道学习样本在输入到神经网络里做学习之前会做卷积与滤波之外还要对样本进行降噪,如我们识别一张人,那么人以外的场景,如:桌子,背景,图片亮度,这些其实都不需要,这部分可以视为噪声,如语音识别过程中人声以外的外界声音这些都是噪声,机器学习需要去噪,保证特征是干净的,完全可靠的。

而验证集样本是不会做去噪的,所以正常情况下曲线理应是在靠近验证集特征的,但又不重叠,不重叠的这部分就是噪声的原因,这样才是正确且合理的,如果完全重叠说明把噪声也学进来了,那么这样就是不合理的,所以就会出现曲线与特征点重叠的样子。

解决这种方法就是重新清洗学习集样本,提高去噪算法核的大小,尽可能的去去噪。

补充知识

拟合是一个数据集表示的概念,不光用在验证特征学习上,还可以用在别的地方上,只需要将你需要验证的数据以点的形式分布在平面图上,然后在进行预测,将预测值以线条方式在平面图绘制出来就可以了,然后可以看线与点的拟合程度来判断当前验证结果。

在绘制拟合时需要注意,设置一个阈值,如果预测与验证差距较大达到这个阈值,那么就不绘制这个点了,这样才能代表这个验证集特征没有被正确验证,这样的话才能绘制出欠拟合的曲线图。

深度学习中拟合是什么意思?相关推荐

  1. 深度学习中防止过拟合的方法

    在深度学习中,当数据量不够大时候,常常采用下面4中方法: 1. 人工增加训练集的大小. 通过平移, 翻转, 加噪声等方法从已有数据中创造出一批"新"的数据.也就是Data Augm ...

  2. 深度学习中模型训练效果不好的原因以及防止过拟合的方法

    深度学习中模型训练效果不好的原因 1. 是否选择合适的损失函数 2. 是否选择了合适的Mini-batch size 3. 是否选择了合适的激活函数 4. 是否选择了合适的学习率 5. 优化算法是否使 ...

  3. 深度学习中的过拟合问题

    1.过拟合问题 欠拟合:根本原因是特征维度过少,模型过于简单,导致拟合的函数无法满足训练集,误差较大. 解决方法:增加特征维度,增加训练数据: 过拟合:根本原因是特征维度过多,模型假设过于复杂,参数过 ...

  4. 深度学习中的一些英文解释

    A: (1)anchors:锚点.(anchors(锚点)定义在RPN网络中) B: (1)bounding box:预测边界框. (2)Botton-up 3D proposal generatio ...

  5. 深度学习中的优化简介

    深度学习算法在许多情况下都涉及到优化. 1. 学习和纯优化有什么不同 在大多数机器学习问题中,我们关注某些性能度量P,其定义于测试集上并且可能是不可解的.因此,我们只是间接地优化P.我们系统通过降低代 ...

  6. 深度学习中的注意力机制(一)

    作者 | 蘑菇先生 来源 | NewBeeNLP 头图 | CSDN下载自视觉中国 目前深度学习中热点之一就是注意力机制(Attention Mechanisms).Attention源于人类视觉系统 ...

  7. 一文读懂深度学习中的各种卷积

    来源|机器之心 我们都知道卷积的重要性,但你知道深度学习领域的卷积究竟是什么,又有多少种类吗?研究学者 Kunlun Bai 发布了一篇介绍深度学习的卷积文章,用浅显易懂的方式介绍了深度学习领域的各种 ...

  8. 卷积有多少种?一文读懂深度学习中的各种卷积

    点击上方"视学算法",选择"星标"公众号 精选作品,第一时间送达 本文选自towardsdatascience 作者:Kunlun Bai 公众号机器之心整理 ...

  9. 干货|卷积有多少种?一文读懂深度学习中的各种卷积

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 我们都知道卷积的重要性,但你知道深度学习领域的卷积究竟是什么,又有 ...

最新文章

  1. CentOS安装中文输入法
  2. java拖动组件,[小娱乐] 一个能拖动组件、改变组件大小的容器
  3. fftw_plan_dft_2d优化
  4. unity3d Update()和FixedUpdate()的区别
  5. java源码阅读LinkedList
  6. 导出 C/C++ API 给 Lua 使用[转]
  7. 没有RunInstallerAttribute.Yes的公共安装程序。
  8. 计算机音乐乡间小路,《乡间的小路课件》初中音乐湘文艺2011课标版七年级下册课件.ppt...
  9. Angular路由开发的一个实际例子
  10. Rafy 框架 - 幽灵插件(假删除)
  11. 《C++标准程序库》学习笔记5 — 第七章
  12. OpenGL画坐标轴指示图
  13. 鸿蒙adb调试权限,真机ro.debuggable全局调试权限修改为1(Nexus 6为例)
  14. python模型训练 warm_start_08-06 细分构建机器学习应用程序的流程-训练模型
  15. 创科视觉软件说明书_【拓斯达 | GGII】20192023年中国机器视觉行业调研
  16. 分表扩展全局序列实际操作_高可用_单表存储千万级_海量存储_分表扩展---MyCat分布式数据库集群架构工作笔记0026
  17. .Net MVC 自定义Action类型,XmlAction,ImageAction等
  18. oracle中季末最后一天,oracle有关时间计算,得到季度第一天、最后一天
  19. 与虚拟机连接出现ora-12514错误解决方法
  20. 密码学·编码类密码·CTF常见考察密码

热门文章

  1. python怎么升级django_线上Django项目python2到3升级日记
  2. 网站未备案不能访问,怎么用ip加端口的方式建站?
  3. 外星人进化_外星人真的比人类强大吗?科学家给出几种猜想,你认同吗?
  4. vue3.0 word导出
  5. python int函数的实现_python实现int函数的案例分析
  6. python函数定义中参数列表里的参数是_python-函数(def)参数 及参数解构 变量 知识整理...
  7. python qq聊天机器人_Python QQBot库的QQ聊天机器人
  8. python tkinter获取屏幕大小_用 Python 制作关不掉的端午安康弹窗
  9. 智能机器人建房子后房价走势_日本房价走势分析:房产投资是否“未来可期”?...
  10. “”和“”的你真的理解吗?