我们训练机器学习模型时,可以选择训练集来拟合目标函数,降低训练误差,并缩小训练误差和测试误差的差距(欠拟合和过拟合)。

        模型的容量(capacity)从本质上说是描述了整个模型的拟合能力的大小。容量低的模型可能在训练集上就会很难拟合目标函数,产生而欠拟合;容量高的模型或许会在训练集上可以很好的拟合目标函数,而不具备一定的泛化能力,导致过拟合。

增加模型容量的方法有很多,比如我们使用线性回归函数来拟合一个线性函数,就可以通过增加参数高次幂的方法来增加模型容量,一个5次多项式(包含从1到5次幂以及常数项)的模型就比二次多项式的模型容量要高。但是如果我们要拟合的是一个三次函数,用二次多项式的模型就会导致欠拟合,用5次多项式就可能会导致过拟合。

        表示容量(representational capacity):模型的最大容量。指的是通过调节参数降低训练目标时,学习算法可以从哪些函数族中选择函数。

        有效容量(effective capacity)​​​​:在实际训练机器学习模型中,从表示容量中选择最优函数是非常困难的,比如我们要拟合一个三次函数,而我们选择的容量中可能包括四次多项式,其实有效容量里是没有四次幂的。实际上我们训练出来的模型只是一个可以大大降低训练误差的函数,并不可能完美,也就说学习算法的有效容量,可能会小于模型的表示容量

【扫盲】机器学习中模型的容量、表示容量、有效容量相关推荐

  1. 机器学习中模型参数和模型超参数分别是什么?有什么区别?

    机器学习中模型参数和模型超参数分别是什么?有什么区别? 目录 机器学习中模型参数和模型超参数分别是什么?有什么区别?

  2. ML之Validation:机器学习中模型验证方法的简介、代码实现、案例应用之详细攻略

    ML之Validation:机器学习中模型验证方法的简介.代码实现.案例应用之详细攻略 目录 模型验证方法的简介 1.Hold-out验证 2.K-折交叉验证 3.自助重采样 模型验证方法的代码实现 ...

  3. 机器学习中模型泛化能力和过拟合现象(overfitting)的矛盾、以及其主要缓解方法正则化技术原理初探...

    1. 偏差与方差 - 机器学习算法泛化性能分析 在一个项目中,我们通过设计和训练得到了一个model,该model的泛化可能很好,也可能不尽如人意,其背后的决定因素是什么呢?或者说我们可以从哪些方面去 ...

  4. python训练模型测试模型_python 机器学习中模型评估和调参

    在做数据处理时,需要用到不同的手法,如特征标准化,主成分分析,等等会重复用到某些参数,sklearn中提供了管道,可以一次性的解决该问题 先展示先通常的做法 import pandas as pd f ...

  5. 机器学习中模型的评估方法

    一.回归模型的评估 指标 描述 metrics方法 Mean Absolute Error(MAE) 平均绝对误差 from sklearn.metrics import mean_absolute_ ...

  6. 机器学习中的模型评价、模型选择及算法选择

    链客,专为开发者而生,有问必答! 此文章来自区块链技术社区,未经允许拒绝转载. 正确使用模型评估.模型选择和算法选择技术无论是对机器学习学术研究还是工业场景应用都至关重要.本文将对这三个任务的相关技术 ...

  7. 机器学习中的数据泄露是什么?构建模型中如何防止数据泄露?正确的方案是什么?如何使用pipeline防止数据泄露?

    机器学习中的数据泄露是什么?构建模型中如何防止数据泄露?正确的方案是什么?如何使用pipeline防止数据泄露? 目录

  8. 医学假阴性?看看在机器学习中如何用来衡量分类模型的效果(附代码)

    来源:数据鸽 本文约1500字,建议阅读5分钟. 本篇我们来看下医学假阴性在机器学习中是如何用来衡量预测结果好坏的. 近日来,新冠肺炎核酸检测"假阴性"引起了关注.所谓的假阴性,就 ...

  9. 一文读懂机器学习中的模型偏差

    一文读懂机器学习中的模型偏差 http://blog.sina.com.cn/s/blog_cfa68e330102yz2c.html 在人工智能(AI)和机器学习(ML)领域,将预测模型参与决策过程 ...

最新文章

  1. tableau实战系列(二十八)-以可视化的方式打开关联分析算法购物篮分析(Market Basket Analysis)
  2. 线上oom 自动kill 程序
  3. Android中对手机文件进行读写
  4. Spring休眠教程
  5. js计算浮点数出现小数;解决js计算小数问题;js数组相加出现小数;
  6. 实战:通过组策略为用户部署软件
  7. linux rar 文件名乱码,linux解压缩文件名乱码问题 亲测可用
  8. hisicv200 exfat支持(转)
  9. C语言 neutralize函数,关于因子数据处理函数中的中性化函数的几个问题
  10. java查询数据库数据放到Excel下载
  11. vijos p1059——积木城堡
  12. ftok函数(file to key)
  13. 【第168期】游戏策划:草率了,这简历像极了脱缰的马儿
  14. 新型搜索引擎Blekko欲赶超谷歌 再获3000万美元投资
  15. 大数据技术基础与应用
  16. 二、Contiki移植
  17. 7E3 Banding
  18. YOLOv5目标检测➕声音告警
  19. 房地产行业商业智能解决方案分享
  20. android国际化-判断国家

热门文章

  1. 自考 计算机网络原理 难吗,自考计算机网络原理本科
  2. Python pip install 下载出错的解决办法
  3. 宜居宜业,智慧社区赋能现代化城市建设
  4. 【解题报告】博弈专场(CF2200~2400)后五题
  5. 识别EAN-13条形码(JavaScript)
  6. vue TimePicker时间选择器组件的回显与格式转变
  7. ASN.1概述及数据类型详解
  8. android华为小艺唤起app,华为小艺使用教程:怎么设置唤醒,有哪些好玩的隐藏功能...
  9. 蜘蛛侠:迈尔斯·莫拉莱斯 实机演示截图及游戏下载
  10. csky linux 编译内核,linux内核编译(八)