训练集、验证集、测试集的作用


详解

用一个不恰当的比喻来说明3种数据集之间的关系:

  • 训练集相当于上课学知识
  • 验证集相当于课后的的练习题,用来纠正和强化学到的知识
  • 测试集相当于期末考试,用来最终评估学习效果

什么是训练集?

训练集(Training Dataset)是用来训练模型使用的。
在《一文看懂机器学习》里我们介绍了机器学习的7个步骤,训练集(Training Dataset)主要在训练阶段使用。

什么是验证集?

当我们的模型训练好之后,我们并不知道他的表现如何。这个时候就可以使用验证集(Validation Dataset)来看看模型在新数据(验证集和测试集是不同的数据)上的表现如何。同时通过调整超参数,让模型处于最好的状态。

验证集有2个主要的作用:

  • 评估模型效果,为了调整超参数而服务
  • 调整超参数,使得模型在验证集上的效果最好 说明:

验证集不像训练集和测试集,它是非必需的。如果不需要调整超参数,就可以不使用验证集,直接用测试集来评估效果。

验证集评估出来的效果并非模型的最终效果,主要是用来调整超参数的,模型最终效果以测试集的评估结果为准。

什么是测试集?

当我们调好超参数后,就要开始「最终考试」了。我们通过测试集(Test Dataset)来做最终的评估。


通过测试集的评估,我们会得到一些最终的评估指标,例如:准确率、精确率、召回率、F1等。

更多划分数据集的方法请见链接。
更多内容请看原文内容:
以下是链接:

https://medium.com/@pkqiang49/%E4%B8%80%E6%96%87%E7%9C%8B%E6%87%82-ai-%E6%95%B0%E6%8D%AE%E9%9B%86-%E8%AE%AD%E7%BB%83%E9%9B%86-%E9%AA%8C%E8%AF%81%E9%9B%86-%E6%B5%8B%E8%AF%95%E9%9B%86-%E9%99%84-%E5%88%86%E5%89%B2%E6%96%B9%E6%B3%95-%E4%BA%A4%E5%8F%89%E9%AA%8C%E8%AF%81-9b3afd37fd58

训练集、验证集、测试集详解和极其作用相关推荐

  1. 【小白学PyTorch】 2.浅谈训练集验证集和测试集

    文章目录: 经验误差与过拟合 评估方法 经验误差与过拟合 关键词:错误率(error rate),精度(accuracy). 错误率好理解,就是m个样本中,a个样本分类错误,则错误率E = a/m . ...

  2. 训练集 验证集_训练与验证、测试集数据分布不同的情况

    在不同分布的数据集上进行训练与验证.测试 深度学习需要大量的数据,但是有时我们可获得的满足我们真实需求分布的数据并不是那么多,不足以对我们的模型进行训练.这时我们就会收集大量相关的数据加入到训练集中, ...

  3. 机器学习典型步骤以及训练集、验证集和测试集概念

    1. 机器学习典型步骤 数据采集和标记 数据清洗 特征选择 如房子的面积.地理位置.朝向.价格等. 模型选择 有监督还是无监督,问题领域.数据量大小.训练时长.模型准确度等多方面有关. 模型训练和测试 ...

  4. 【入门篇】如何正确使用机器学习中的训练集、验证集和测试集?

    [注] ·本文为转载文章,原文作者是王树义老师,原文链接为 https://zhuanlan.zhihu.com/p/71961236 训练集.验证集和测试集,林林总总的数据集合类型,到底该怎么选.怎 ...

  5. 训练集(train set) 验证集(validation set) 测试集(test set)

    在有监督(supervise)的机器学习中,数据集常被分成2~3个,即:训练集(train set) 验证集(validation set) 测试集(test set). http://blog.si ...

  6. 机器学习中训练集、验证集和测试集的区别

    通常,在训练有监督的机器学习模型的时候,会将数据划分为训练集.验证集合测试集,划分比例一般为0.6:0.2:0.2.对原始数据进行三个集合的划分,是为了能够选出效果(可以理解为准确率)最好的.泛化能力 ...

  7. [机器学习] 训练集(train set) 验证集(validation set) 测试集(test set)

    在有监督(supervise)的机器学习中,数据集常被分成2~3个即: 训练集(train set) 验证集(validation set) 测试集(test set) 一般需要将样本分成独立的三部分 ...

  8. 训练集、验证集和测试集的意义

    原文 在有监督的机器学习中,经常会说到训练集(train).验证集(validation)和测试集(test),这三个集合的区分可能会让人糊涂,特别是,有些读者搞不清楚验证集和测试集有什么区别. I. ...

  9. Recbole自定义训练集、验证集和测试集推荐

    文章目录 Recbole简介 Recbole使用 自定义训练集.验证集和测试集 Recbole简介 Recbole(中文名称:伯乐)是一款使用Python开发的开源推荐框架,里面集成了大量的推荐模型, ...

最新文章

  1. RAD Studio XE2/XE3 官方 ISO 下载地址 (2012-09-05更新)
  2. 学会这9招,你也能成为演讲高手
  3. 使用DFS求任意两点的所有路径
  4. Java pdf文件传输_java中pdf文件的管理(pdf文件转png文件,base64传输文件以及删除)...
  5. 前端学习(2859):简单秒杀系统学习之前端界面布局
  6. ZT 类模板Stack的实现 by vector
  7. ASP.NET MVC Bootstrap极速开发框架
  8. PC端稳定性测试探索
  9. IP,TCP 和 HTTP
  10. 法学类计算机专业,就业蓝皮书:计算机类专业领跑薪酬榜 法学专业被亮“红牌”...
  11. libevent源码分析:bufferevent
  12. 【游戏开发实战】Unity UGUI序列帧动画(蓝胖子序列帧图)
  13. 2019年5月个人总结:大家都在跨界,原谅自己的懈怠
  14. 【等保测评】等保测评师怎么考,前景怎么样?
  15. JS放大镜小功能功能之原理详细解析
  16. 15_岭回归-Ridge、岭回归API、线性回归和岭回归的对别;逻辑回归、sigmoid函数、逻辑回归公式、损失函数、逻辑回归API、逻辑回归案例、逻辑回归的优缺点、逻辑回归 VS 线性回归等
  17. 基于51单片机的电烤箱微波炉数码管显示proteus仿真
  18. macos 10.15 软件损坏/无法验证开发者
  19. batch软件功能测试,Batch SMART 最强序列特征[结构域]预测软件
  20. Scrapy-Splash爬取淘宝排行榜(三)

热门文章

  1. python编程(redis操作)
  2. 从skyeye学习arm( linux篇)
  3. java做jsp问题_java/jsp中 中文问题详解
  4. linux 批量传文件大小,小弟我使用过的Linux命令之rz - 批量下传文件,简单易用...
  5. php 跳转历史页面,js不记录页面跳转历史的解决方法
  6. suse linux修改ftp端口,suse Linux系统下的网络设置(ftp telnet xmanager)
  7. html上下走马灯特效,上下左右滚动的走马灯文字代码
  8. html5语义化编程,HTML5常用的语义化标签
  9. banner信息是什么_Spring Boot 2 尝鲜-动态 Banner
  10. 超经典两万字,MySQL数据库快速入门。