训练集、验证集、测试集详解和极其作用
训练集、验证集、测试集的作用
详解
用一个不恰当的比喻来说明3种数据集之间的关系:
- 训练集相当于上课学知识
- 验证集相当于课后的的练习题,用来纠正和强化学到的知识
- 测试集相当于期末考试,用来最终评估学习效果
什么是训练集?
训练集(Training Dataset)是用来训练模型使用的。
在《一文看懂机器学习》里我们介绍了机器学习的7个步骤,训练集(Training Dataset)主要在训练阶段使用。
什么是验证集?
当我们的模型训练好之后,我们并不知道他的表现如何。这个时候就可以使用验证集(Validation Dataset)来看看模型在新数据(验证集和测试集是不同的数据)上的表现如何。同时通过调整超参数,让模型处于最好的状态。
验证集有2个主要的作用:
- 评估模型效果,为了调整超参数而服务
- 调整超参数,使得模型在验证集上的效果最好 说明:
验证集不像训练集和测试集,它是非必需的。如果不需要调整超参数,就可以不使用验证集,直接用测试集来评估效果。
验证集评估出来的效果并非模型的最终效果,主要是用来调整超参数的,模型最终效果以测试集的评估结果为准。
什么是测试集?
当我们调好超参数后,就要开始「最终考试」了。我们通过测试集(Test Dataset)来做最终的评估。
通过测试集的评估,我们会得到一些最终的评估指标,例如:准确率、精确率、召回率、F1等。
更多划分数据集的方法请见链接。
更多内容请看原文内容:
以下是链接:
https://medium.com/@pkqiang49/%E4%B8%80%E6%96%87%E7%9C%8B%E6%87%82-ai-%E6%95%B0%E6%8D%AE%E9%9B%86-%E8%AE%AD%E7%BB%83%E9%9B%86-%E9%AA%8C%E8%AF%81%E9%9B%86-%E6%B5%8B%E8%AF%95%E9%9B%86-%E9%99%84-%E5%88%86%E5%89%B2%E6%96%B9%E6%B3%95-%E4%BA%A4%E5%8F%89%E9%AA%8C%E8%AF%81-9b3afd37fd58
训练集、验证集、测试集详解和极其作用相关推荐
- 【小白学PyTorch】 2.浅谈训练集验证集和测试集
文章目录: 经验误差与过拟合 评估方法 经验误差与过拟合 关键词:错误率(error rate),精度(accuracy). 错误率好理解,就是m个样本中,a个样本分类错误,则错误率E = a/m . ...
- 训练集 验证集_训练与验证、测试集数据分布不同的情况
在不同分布的数据集上进行训练与验证.测试 深度学习需要大量的数据,但是有时我们可获得的满足我们真实需求分布的数据并不是那么多,不足以对我们的模型进行训练.这时我们就会收集大量相关的数据加入到训练集中, ...
- 机器学习典型步骤以及训练集、验证集和测试集概念
1. 机器学习典型步骤 数据采集和标记 数据清洗 特征选择 如房子的面积.地理位置.朝向.价格等. 模型选择 有监督还是无监督,问题领域.数据量大小.训练时长.模型准确度等多方面有关. 模型训练和测试 ...
- 【入门篇】如何正确使用机器学习中的训练集、验证集和测试集?
[注] ·本文为转载文章,原文作者是王树义老师,原文链接为 https://zhuanlan.zhihu.com/p/71961236 训练集.验证集和测试集,林林总总的数据集合类型,到底该怎么选.怎 ...
- 训练集(train set) 验证集(validation set) 测试集(test set)
在有监督(supervise)的机器学习中,数据集常被分成2~3个,即:训练集(train set) 验证集(validation set) 测试集(test set). http://blog.si ...
- 机器学习中训练集、验证集和测试集的区别
通常,在训练有监督的机器学习模型的时候,会将数据划分为训练集.验证集合测试集,划分比例一般为0.6:0.2:0.2.对原始数据进行三个集合的划分,是为了能够选出效果(可以理解为准确率)最好的.泛化能力 ...
- [机器学习] 训练集(train set) 验证集(validation set) 测试集(test set)
在有监督(supervise)的机器学习中,数据集常被分成2~3个即: 训练集(train set) 验证集(validation set) 测试集(test set) 一般需要将样本分成独立的三部分 ...
- 训练集、验证集和测试集的意义
原文 在有监督的机器学习中,经常会说到训练集(train).验证集(validation)和测试集(test),这三个集合的区分可能会让人糊涂,特别是,有些读者搞不清楚验证集和测试集有什么区别. I. ...
- Recbole自定义训练集、验证集和测试集推荐
文章目录 Recbole简介 Recbole使用 自定义训练集.验证集和测试集 Recbole简介 Recbole(中文名称:伯乐)是一款使用Python开发的开源推荐框架,里面集成了大量的推荐模型, ...
最新文章
- RAD Studio XE2/XE3 官方 ISO 下载地址 (2012-09-05更新)
- 学会这9招,你也能成为演讲高手
- 使用DFS求任意两点的所有路径
- Java pdf文件传输_java中pdf文件的管理(pdf文件转png文件,base64传输文件以及删除)...
- 前端学习(2859):简单秒杀系统学习之前端界面布局
- ZT 类模板Stack的实现 by vector
- ASP.NET MVC Bootstrap极速开发框架
- PC端稳定性测试探索
- IP,TCP 和 HTTP
- 法学类计算机专业,就业蓝皮书:计算机类专业领跑薪酬榜 法学专业被亮“红牌”...
- libevent源码分析:bufferevent
- 【游戏开发实战】Unity UGUI序列帧动画(蓝胖子序列帧图)
- 2019年5月个人总结:大家都在跨界,原谅自己的懈怠
- 【等保测评】等保测评师怎么考,前景怎么样?
- JS放大镜小功能功能之原理详细解析
- 15_岭回归-Ridge、岭回归API、线性回归和岭回归的对别;逻辑回归、sigmoid函数、逻辑回归公式、损失函数、逻辑回归API、逻辑回归案例、逻辑回归的优缺点、逻辑回归 VS 线性回归等
- 基于51单片机的电烤箱微波炉数码管显示proteus仿真
- macos 10.15 软件损坏/无法验证开发者
- batch软件功能测试,Batch SMART 最强序列特征[结构域]预测软件
- Scrapy-Splash爬取淘宝排行榜(三)
热门文章
- python编程(redis操作)
- 从skyeye学习arm( linux篇)
- java做jsp问题_java/jsp中 中文问题详解
- linux 批量传文件大小,小弟我使用过的Linux命令之rz - 批量下传文件,简单易用...
- php 跳转历史页面,js不记录页面跳转历史的解决方法
- suse linux修改ftp端口,suse Linux系统下的网络设置(ftp telnet xmanager)
- html上下走马灯特效,上下左右滚动的走马灯文字代码
- html5语义化编程,HTML5常用的语义化标签
- banner信息是什么_Spring Boot 2 尝鲜-动态 Banner
- 超经典两万字,MySQL数据库快速入门。