一、超参数定义:

超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。和一般的参数比如权重、偏置之类的有差别。

通常情况下,需要对超参数进行优化,给学习机选择一组最优超参数,以提高学习的性能和效果。

有时一个选项被设为学习算法不用学习的超参数,是因为它太难优化了。更多的情况是,该选项必须是超参数,因为它不适合在训练集上学习。这适用于控制模型容量的所有超参数。如果在训练集上学习超参数,这些超参数总是趋向于最大可能的模型容量,导致过拟合例如,相比低次多项式和正的权重衰减设定,更高次的多项式和权重衰减参数设定 λ = 0 总能在训练集上更好地拟合。

二、超参数的例子:

树的数量或树的深度、矩阵分解中潜在因素的数量、学习率(多种模式)、深层神经网络隐藏层数、k均值聚类中的簇数等。

三、关于超参数的优化:

百度百科中关于超参数写了这样三句话:1、定义关于模型的更高层次的概念,如复杂性或学习能力;2、不能直接从标准模型培训过程中的数据中学习,需要预先定义;3、可以通过设置不同的值,训练不同的模型和选择更好的测试值来决定。

其实讲得差不多是一个意思。但是第3点没有讲清楚,既然机器学习过程中无法训练我们的超参数,那么我们如何优化我们的超参数?

我们需要一个训练算法观测不到的验证集(validation set) 样本:

我们讨论过和训练数据相同分布的样本组成的测试集,它可以用来估计学习过程完成之后的学习器的泛化误差。其重点在于测试样本不能以任何形式参与到模型的选择中包括设定超参数。基于这个原因,测试集中的样本不能用于验证集。 因此,我们总是从训练数据中构建验证集。特别地,我们将训练数据分成两个不相交的子集。其中一个用于学习参数。另一个作为验证集,用于估计训练中或训练后 的泛化误差,更新超参数。用于学习参数的数据子集通常仍被称为训练集,尽管这 会和整个训练过程用到的更大的数据集相混。用于挑选超参数的数据子集被称为 验 证集(validation set)。通常,80% 的训练数据用于训练,20% 用于验证。由于验证集是用来 ‘‘训练’’ 超参数的,尽管验证集的误差通常会比训练集误差小,验证集会低估泛化误差。所有超参数优化完成之后,泛化误差可能会通过测试集来估计。

超参数及其优化办法:验证集相关推荐

  1. CS231n课程笔记5.4:超参数的选择交叉验证

    CS231n简介 详见 CS231n课程笔记1:Introduction.  注:斜体字用于注明作者自己的思考,正确性未经过验证,欢迎指教. 1. 超参数有哪些 与超参数对应的是参数.参数是可以在模型 ...

  2. 基于Python的随机森林(RF)回归与多种模型超参数自动优化方法

      本文详细介绍基于Python的随机森林(Random Forest)回归算法代码与模型超参数(包括决策树个数与最大深度.最小分离样本数.最小叶子节点样本数.最大分离特征数等等)自动优化代码.    ...

  3. 自动化机器学习(一)超参数自动优化技术

    文章目录 技术介绍 核心技术栈 项目选择 数据 基础模型 Hyperopt 实现 数据读取 使用lightgbm中的cv方法 定义参数空间 展示结果 贝叶斯优化 原理 使用lightgbm中的cv方法 ...

  4. 深度学习中的验证集和超参数简介

    大多数机器学习算法都有超参数,可以设置来控制算法行为.超参数的值不是通过学习算法本身学习出来的(尽管我们可以设计一个嵌套的学习过程,一个学习算法为另一个学习算法学出最优超参数). 在多项式回归示例中, ...

  5. 深度学习-超参数和交叉验证

    一. 1.什么是超参数 没接触过机器学习的人可能对这个概念比较模糊.我们可以从两方面来理解 (1)参数值的产生由来 超参数是在开始学习过程之前设置值的参数(人为设置),而不是通过训练得到的参数数据. ...

  6. 机器学习验证集为什么不再有新意?

    2020-03-01 18:19 导语:摆脱过时的规则和思维定式刻不容缓! 机器学习中,一般将样本数据分成独立的三部分:训练集.验证集和测试集. 其中验证集在机器学习中所起到的作用是:开发模型总需要调 ...

  7. 训练集的识别率一直波动_机器学习验证集为什么不再有新意?

    机器学习中,一般将样本数据分成独立的三部分:训练集.验证集和测试集. 其中验证集在机器学习中所起到的作用是:开发模型总需要调节模型的参数,而整个调节过程需要在验证集数据上运行训练的模型,从而给出其表现 ...

  8. 训练集、验证集、测试集的作用和区别

    一.概述 简单说,训练集就是用来训练模型用的,验证集为了验证模型的效果, 测试集用来最终评测.所以基于这个,那训练数据的时候,就不要使用验证集和测试集的相关信息,包括统计均值方差特征等, 但是验证集可 ...

  9. 深度学习炼丹-超参数设定和模型训练

    前言 网络层内在参数 使用 3x3 卷积 使用 cbr 组合 尝试不同的权重初始化方法 图片尺寸与数据增强 batch size 设定 背景知识 batch size 定义 选择合适大小的 batch ...

最新文章

  1. 奥巴马表示10天内债务谈判出结果 债务违约可能性底
  2. 数据处理程序的一点经验
  3. 使用TestContainers进行数据库测试
  4. python3.4新特性_Python3中的新特性(1)——新的语言特性
  5. Week 1:那些值得一阅的好文章
  6. python 输出彩色文字
  7. Splay_Tree 模板(区间修改,旋转操作)
  8. javascript学习之使文本框中不能输入数字
  9. Codeforces Round #310 (Div. 1) B. Case of Fugitive set
  10. 【基础教程】基于matlab局部特征检测与提取【1749期】
  11. linux操作系统关闭防火墙,linux操作系统关闭防火墙的方法
  12. 大流量下订单号生成方法
  13. jQuery EasyUI详解-EasyUI环境配置
  14. getPhoneNumber:fail Error: 用户绑定的手机需要进行验证,请在客户端完成短信验证
  15. 苹果手机刷机显示无法联系软件更新服务器,为什么苹果手机无法自动更新软件怎么办...
  16. 乘车码来了,地铁公交都可以刷微信了
  17. SpringBoot整合Redis实现缓存、队列、广播
  18. 研报:HTML5或将迎来爆发期
  19. Python 量化投资原来这么简单(5) — A股回测KDJ策略
  20. Praat使用 | 辅助Praat进行标注的工具

热门文章

  1. 智能体温检测系统解决方案
  2. 诛仙 第一集 第八章 传艺
  3. 深圳软件测试培训:软件测试的工资高还是开发者工资高?
  4. 关于WIN10开机无法输入密码的问题
  5. [编程基础] Python谷歌翻译库googletrans总结
  6. 《Cisco IPv6网络实现技术(修订版)》一1.5 IPv5
  7. oracle 横竖互换,oracle横竖表互转
  8. XX健康:预约管理-预约设置日历插件文件简单下载Excel文件解析Excel表数据批量导入
  9. 朴素贝叶斯的三个常用模型: 高斯、多项、伯努利的原理和解释
  10. 搭建一个SV验证环境(1)