模型选择

1、训练误差和泛化误差

训练误差:模型在训练数据上的误差

泛化误差:模型在新数据上的误差(关心泛化误差)

2、验证数据集和测试数据集

验证数据集:用来评估弄模型好坏的数据集

一般50%训练数据集,50%作为验证数据集(用来调整超参数),验证数据集和训练数据集不能混在一起

测试数据集:只用一次的数据集(不能用来调超参数)

例如:未来的考试,kaggle私有排行榜中的数据集

论文中test data大部分实际上是验证数据集

3、K-则交叉验证——在没有足够多数据时使用

算法:将训练数据分割成k块,for i=1,...,k,使用第i块作为验证数据集,其余的作为训练数据集,报告k个验证集误差的平均

常用:K=5或10

过拟合和欠拟合

1、模型容量

模型容量:拟合各种函数的能力

估计模型容量

(1)难以在不同种类算法之间比较,例如树模型和神经网络

(2)给定一个模型种类,将有两个主要因素:参数的个数,参数值的选择范围

VC维

模型复杂度等价于模型能够记住的数据集的大小

对于一个分类模型,VC 等于一个最大的数据集的大小,不管如何给定标号,都存在一个模型来对它进行完美分类

注意:异或问题(4个点)不能用线性分类器解决,需要曲线

2、数据复杂度

多个重要因素:样本个数、每个样本的元素个数、时间空间结构、多样性

过拟合的处理——权重衰退

模型复杂度的限制方法:控制参数个数、控制参数值的范围(即权重衰退)

权重衰退其实就是加入L2正则项

λ代表惩罚项的重要性,λ值越大,惩罚越严重

为什么叫权重衰退?

加入惩罚项以后,参数更新时W_t 会先变小(乘1-ηλ)再减学习率η乘梯度,所以叫权重衰退。

模型选择、过拟合和欠拟合、权重衰退相关推荐

  1. 动手学深度学习V2.0(Pytorch)——11.模型选择+过拟合和欠拟合

    文章目录 1. 模型选择 2. 过拟合和欠拟合 3. 代码 4. Q&A 4.1 SVM和神经网络相比,缺点在哪里 4.2 训练集验证集测试集比例 4.3 时序预测问题中的测试集训练集 4.4 ...

  2. 模型优化中的过拟合与欠拟合

    知识点:过拟合.欠拟合,以及它们与正则化的权重.模型参数的复杂度.和训练集样本数的关系图 转载:http://blog.csdn.net/lonelyrains/article/details/493 ...

  3. 机器学习模型调优方法(过拟合、欠拟合、泛化误差、集成学习)

    机器学习模型调优方法 过拟合和欠拟合 降低过拟合风险的方法 降低欠拟合风险的方法 泛化误差.偏差和方差 泛化误差 偏差和误差 模型评估 Holdout检验 交叉检验 自助法 集成学习 Boosting ...

  4. TensorFlow模型构建(过拟合和欠拟合)三

    本文主要整理自tensorflow学习文档.主要讲模型训练中的过拟合和欠拟合,以及常用的一些正则化方法. 概要 模型训练常常会出现过拟合和欠拟合,解决过拟合问题有很多方法,其中最简单的方法就是使用完整 ...

  5. tensorflow2.0中valid_data的作用是在训练的过程对对比训练数据与测试数据的准确率 损失率,便于判断模型的训练效果:是过拟合还是欠拟合(过拟合)

    tensorflow2.0中valid_data的作用是在训练的过程对对比训练数据与测试数据的准确率,便于判断模型的训练效果:是过拟合还是欠拟合 过拟合:训练数据的准确率较高而测试数据的准确率较低 欠 ...

  6. 使用学习曲线(Learning curve),判断机器学习模型过拟合、欠拟合,与解决过拟合、欠拟合的问题

    文章目录 1.基本概念 过拟合与欠拟合 根据学习曲线判断过拟合.欠拟合 2.示例代码:绘制学习曲线 3.解决过拟合.欠拟合 解决过拟合 解决欠拟合 4. 过拟合.欠拟合的深层理解 1.基本概念 过拟合 ...

  7. 百面机器学习 #2 模型评估:07 过拟合和欠拟合及其常用解决方法

    如何有效地识别"过拟合"和"欠拟合"现象,并有针对性地进行模型调整,是不断改进机器学习模型的关键. 过拟合 模型对于训练数据拟合呈过当的情况 反映到评估指标上, ...

  8. KNN和K-means的区别 为什么KNN算法里的K越小模型会越复杂? 过拟合和欠拟合的偏差和方差问题

    这里将这三个问题在一起讲,仅仅是因为自己觉得有些联系,而且正好自己概念有些模糊. 1. KNN 和 K-means的区别:参考https://www.cnblogs.com/nucdy/p/63491 ...

  9. 机器学习模型评估  过拟合与欠拟合的改进方案

    在模型评估与调整的过程中, 我们往往会遇到"过拟合"或"欠拟合"的情况. 如何有效地识别"过拟合"和"欠拟合"现象, 并 ...

最新文章

  1. 为ios 应用程序添加图标和添加名字
  2. 工具的特性_16 个好用的 Code Review 工具
  3. 【thymeleaf】 Link (URL) expressions: 使用 Link 表达式创建 URL
  4. Spring Cloud生态系统
  5. leetcode 752. Open the Lock | 752. 打开转盘锁(BFS)
  6. selenium打开Firefox、IE、Chrome浏览器【python】
  7. 联想将推出全新系列笔记本
  8. C语言循环时无故释放变量吗,C语言 - while循环体内变量重新声明,陷入***循环。...
  9. imx6ull EMMC和NABD 的移植注意事项,差别
  10. 借助阿里AntUI元素实现两个Web页面之间的过渡——“Loading…”
  11. 结果不对_男子去医院抽血体检,拿到化验单发现不对劲,医院:医生专业不精...
  12. 如何提升自身的C++开发技术?
  13. python函数 模块先加载到内存后执行_Python从内存中使用编译后的模块
  14. js使用闭包循环为a标签正确添加事件
  15. 文字处理技术:布局的核心是行布局,难点是换行算法
  16. javascript基础常识问答(二)
  17. Masked Autoencoders Are Scalable Vision Learners (MAE)
  18. C#打包文件夹成zip格式(包括文件夹和子文件夹下的所有文件)
  19. 2018西安邮电大学计算机学院,西安邮电大学计算机学院
  20. js-获取JSON数组的长度

热门文章

  1. 论文笔记:Extendability for Threshold Ring Signatures
  2. linux 内存溢出排查_java 内存溢出 栈溢出的原因与排查方法
  3. vue中vue-touch 的使用
  4. 福建省计算机二级考试知识点,2015福建省计算机等级考试试题 二级C试题考试技巧重点...
  5. 30 岁,还好,还在 Coding,不卷了
  6. 第二周 day2:基础数据类型的补充:list,dict遍历删除/set的相关操作
  7. vue.js -- 获取dom元素的样式(非行内样式)
  8. 菜鸟从零开始做报表3-----点点滴滴
  9. 零基础学习Python数据分析,学习资源大整合
  10. mysql的设置更改root密码、连接、常用命令