随笔
神经网络训练确实是loss越小,效果越好,但不是绝对的。
因为损失小只是对训练集而言,所以要划出部分数据不做训练,只做验证,即为验证集,验证集对网络训练是没影响的,
所以要将数据集分成:训练集,验证集,测试集

其实 训练集,验证集 都是有 输入(input)及标签(label)的,所以都可以拿来训练,即前向传播–>求损失–>反向传播。

验证集存在的意义就是“验证”,验证集不需要反向传播计算(即训练),
验证集是用来验证训练集得到的模型的输出效果(准确率,得分等),

某些情况带入验证集求损失,通过得到‘最小’损失,验证集的损失不做反向传播计算
但是此处的‘最小’损失,用来验证最优模型。
因为验证集不会影响、修改网络模型,可以说验证集是验证网络模型的泛化效果

测试集是没有标签(label)的,将测试集带入模型得到的输出,是没法通过量化衡量效果的,如一些比赛,用测试集来输出结果,然后提交官方。

其实训练集,验证集 可以统一归为一个大的训练集

有些情况是只有训练集的。
1.你可以将训练集全部用来训练,这样省事,但你只能知道训练集内部的效果。
对于训练集内部的数据肯定效果好,但是训练集外部的数据就不一定了

2.而利用kfold 将数据集分成k份,如分成5份,取4份作为训练数据,1份作为验证数据,训练数据之外的验证数据验证模型的泛化效果
每个epoch训练完数据之后,在带入验证数据验证效果,

第二种效果可能会更好,即使少了一部分训练数据

k折利用python的sklearn库处理
from sklearn.model_selection import KFold

个人观点

深度神经网络(训练集,验证集,测试集), 提升模型效果,交叉验证相关推荐

  1. 深度神经网络训练过程中为什么验证集上波动很大_图神经网络的新基准

    作者 | 李光明 编辑 | 贾 伟 编者注:本文解读论文与我们曾发文章<Bengio 团队力作:GNN 对比基准横空出世,图神经网络的「ImageNet」来了>所解读论文,为同一篇,不同作 ...

  2. 吴恩达神经网络和深度学习-学习笔记-6-训练集、验证集和测试集 + 偏差bias和方差variance

    寻找最优超参数是一个迭代过程 在今天,应用深度学习是一个典型的迭代过程. 创建高质量的训练数据集.验证集和测试集,有助于提高循环效率. 训练集.验证集和测试集 数据Data分为三部分: 训练集trai ...

  3. 【神经网络】学习笔记十五——训练集,验证集和测试集

    以前一直知道神经网络划分数据集时要分为训练集,测试集和验证集,但不知道并且一般以6:2:2的比例划分,到头来不知道这三者各是啥,以及他们的作用是什么.本片文档解释一下三者的作用. 重点在于验证集和测试 ...

  4. [机器学习] 训练集(train set) 验证集(validation set) 测试集(test set)

    在有监督(supervise)的机器学习中,数据集常被分成2~3个即: 训练集(train set) 验证集(validation set) 测试集(test set) 一般需要将样本分成独立的三部分 ...

  5. 训练集、验证集和测试集的概念及划分原则

    深度学习中,常将可得的数据集划分为训练集(training set),验证集(development set/validation set)和测试集(test set).下文主要回答以下几个问题:一是 ...

  6. 如何正确使用机器学习中的训练集、验证集和测试集?

    王树义 读完需要 19 分钟 速读仅需7分钟 训练集.验证集和测试集,林林总总的数据集合类型,到底该怎么选.怎么用?看过这篇教程后,你就能游刃有余地处理它们了. 1 问题 审稿的时候,不止一次,我遇到 ...

  7. 什么是训练集、验证集和测试集?

    在机器学习中,训练集.验证集和测试集是数据集的三个重要部分,用于训练.评估和测试机器学习模型的性能.它们的定义和作用如下: 什么是训练集.验证集和测试集? 训练集:训练集是机器学习模型用于训练和学习的 ...

  8. 【入门篇】如何正确使用机器学习中的训练集、验证集和测试集?

    [注] ·本文为转载文章,原文作者是王树义老师,原文链接为 https://zhuanlan.zhihu.com/p/71961236 训练集.验证集和测试集,林林总总的数据集合类型,到底该怎么选.怎 ...

  9. 【小白学PyTorch】 2.浅谈训练集验证集和测试集

    文章目录: 经验误差与过拟合 评估方法 经验误差与过拟合 关键词:错误率(error rate),精度(accuracy). 错误率好理解,就是m个样本中,a个样本分类错误,则错误率E = a/m . ...

  10. 训练集 验证集_训练与验证、测试集数据分布不同的情况

    在不同分布的数据集上进行训练与验证.测试 深度学习需要大量的数据,但是有时我们可获得的满足我们真实需求分布的数据并不是那么多,不足以对我们的模型进行训练.这时我们就会收集大量相关的数据加入到训练集中, ...

最新文章

  1. Lighttpd 配置与性能优化
  2. SendTextMessage 等方便的消息发送函数
  3. vue中的浏览量_vue中前进刷新、后退缓存用户浏览数据和浏览位置的实践
  4. 【数据挖掘知识点四】参数估计
  5. pytorch 实现transformer
  6. 狗窝里的小日子- 5 ...
  7. clickhouse 重启_篇一|ClickHouse快速入门
  8. java 指定垃g1圾收集_Java知识梳理--JVM
  9. 画一个空心圆_圆形在PPT中的6大妙用,每一个都能瞬间提升PPT的逼格!
  10. 7. Shell 脚本编写
  11. open ball、closed ball 与 open set、closed set(interior point,limit point)、dense set
  12. VMware 虚拟机NAT模式下却没有网
  13. crypto-js加密、解密
  14. 光明勇士iOS服务器维护,裕际网络科技《光明勇士》3月11日 iOSamp;安卓部分区服数据互通公告 - 热门手游公告-TK游戏...
  15. word转html linux java,Java-linux下如何代码实现word转换成html
  16. nacos启动报错 Unable to start embedded Tomcat 以及项目链接nacos报错 server is DOWN now, please try again later!
  17. 开始甲骨文培训了,第一天说了一下上课学习规矩及计算机基础
  18. 谈谈百度贴吧、豆瓣小组以及BBS这个产品形态
  19. python修改excel背景色,基于python的excel背景颜色控制
  20. WOT全球技术创新大会2022即将召开,亮点抢先看

热门文章

  1. TouchDesigner使用之一-下载安装
  2. Word进阶学习总结
  3. 手机变为无线猫:通过笔记本轻松无线上网
  4. 推荐13个优秀的网站检测工具
  5. libmodbus官方手册中文翻译
  6. Centos7 重启后ens33消失(外部连接不上)
  7. python抽样_python数据预处理 :数据抽样解析
  8. ModStartCMS v2.6.0 用着真得劲,头发也浓密了
  9. 雪人计划服务器型号,雪人计划 ipv6网络是什么
  10. 乘方(pow) CSP-J2022