目录

0. 前言

1. 评估模型过程

2. 最高次幂对方差偏差的影响

3. 正则化参数对方差偏差的影响

4. 高偏差的学习曲线

5. 高方差的学习曲线

6. 对机器学习算法的调试


学习完吴恩达老师机器学习课程的应用机器学习的建议,简单的做个笔记。文中部分描述属于个人消化后的理解,仅供参考。

如果这篇文章对你有一点小小的帮助,请给个关注喔~我会非常开心的~

0. 前言

对训练集进行模型训练的时候,通常会存在两种问题,“过拟合”和“欠拟合”,分别对应高方差(high variance)和高偏差(high bias)。

  • 高方差:拟合程度过好,以至于过拟合,无法泛化新的样本数据
  • 高偏差:拟合程度太差,以至于欠拟合,存在很大的误差

1. 评估模型过程

  1. 随机划分训练集和测试集
  2. 用训练集进行模型训练,降低  ,用测试集计算 
  3. 或者采用错误分类率 

2. 最高次幂对方差偏差的影响

如图所示(图源:吴恩达机器学习),横坐标为最高次幂,纵坐标为错误分类率或者代价函数,一般情况下:

  • 当  很小时,曲线无法拟合大部分数据,具有高偏差,
  • 当  很大时,曲线拟合训练集过好,造成无法泛化测试集,具有高方差,

3. 正则化参数对方差偏差的影响

如图所示(图源:吴恩达机器学习),横坐标为正则化参数  ,纵坐标为错误分类率或者代价函数,一般情况下:

  • 当  很小时,未减少权重系数的大小,曲线对训练集的拟合程度很好,具有高方差
  • 当  很大时,减少权重系数太多,曲线无法很好的拟合数据,具有高偏差

4. 高偏差的学习曲线

如图所示(图源:吴恩达机器学习),横坐标为训练集大小,纵坐标为错误分类率或者代价函数,一般情况下:

  • 随着数据集的增大,训练集的误差会越来越大,测试集的误差会越来越小
  • 当  时, 训练集和测试集的误差均会趋近于一个较大的常数

5. 高方差的学习曲线

如图所示(图源:吴恩达机器学习),横坐标为训练集大小,纵坐标为错误分类率或者代价函数,一般情况下:

  • 随着数据集的增大,训练集的误差会越来越大,测试集的误差会越来越小
  • 训练集的误差和测试集的误差之间的间隙较大

6. 对机器学习算法的调试

  • 采用更多的训练集  解决高方差(过拟合)
  • 减少特征数量  解决高方差(过拟合)
  • 增加特征数量  解决高偏差(欠拟合)
  • 增加最高次幂  解决高偏差(欠拟合)
  • 降低正则化系数   解决高偏差(欠拟合)
  • 增加正则化系数   解决高方差(过拟合)

如果这篇文章对你有一点小小的帮助,请给个关注喔~我会非常开心的~

吴恩达机器学习(八)偏差与方差相关推荐

  1. 吴恩达机器学习:偏差与方差、欠拟合与过拟合

    在吴恩达机器学习课程的第86课时中,讲解了偏差和方差与欠拟合和过拟合的关系. 1.偏差与方差的概念 先看下网上关于偏差与方差的例子. 该例子可以理解为射击打靶. 偏差指的是多次射击的平均环数与环心的偏 ...

  2. 机器学习(吴恩达)笔记——高偏差高方差

    转载自https://blog.csdn.net/The_lastest/article/details/78357727?locationNum=9&fps=1 学习曲线(learning ...

  3. 西瓜书+实战+吴恩达机器学习(二)机器学习基础(偏差、方差、调试模型技巧)

    文章目录 0. 前言 1. 偏差方差的解决方法 2. 高偏差高方差的学习曲线 3. 调试模型技巧 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~ 0. 前言 泛化误差可分解为 ...

  4. 吴恩达机器学习作业Python实现(五):偏差和方差

    吴恩达机器学习系列作业目录 在本练习中,您将实现正则化的线性回归和多项式回归,并使用它来研究具有不同偏差-方差属性的模型 1 Regularized Linear Regression 正则线性回归 ...

  5. 吴恩达机器学习课后作业——偏差和方差

    1.写在前面 吴恩达机器学习的课后作业及数据可以在coursera平台上进行下载,只要注册一下就可以添加课程了.所以这里就不写题目和数据了,有需要的小伙伴自行去下载就可以了. 作业及数据下载网址:吴恩 ...

  6. 5. 吴恩达机器学习课程-作业5-偏差和方差

    fork了别人的项目,自己重新填写,我的代码如下 https://gitee.com/fakerlove/machine-learning/tree/master/code 代码原链接 文章目录 5. ...

  7. 【Nan‘s 吴恩达机器学习笔记】第八、九章 神经网络

    [Nan's 吴恩达机器学习笔记]第八.九章 神经网络 神经网络(Neural Networks) 8.1 非线性假设 8.2 模型表示 前向传播算法(Forward Propagation) 8.3 ...

  8. 吴恩达机器学习作业Python实现(八):异常检测和推荐系统

    吴恩达机器学习系列作业目录 1 Anomaly detection 这部分,您将实现一个异常检测算法来检测服务器计算机中的异常行为.他的特征是测量每个服务器的响应速度(mb/s)和延迟(ms).当你的 ...

  9. 带你少走弯路:五篇文章学完吴恩达机器学习

    本文是吴恩达老师的机器学习课程[1]的笔记和代码复现部分,这门课是经典,没有之一.但是有个问题,就是内容较多,有些内容确实有点过时. 如何在最短时间学完这门课程?作为课程的主要翻译者和笔记作者,我推荐 ...

最新文章

  1. java 中断 继续_关于中断的线程如何继续。。在线等
  2. 百度绝对控股,小度科技独立融资,投后估值200亿元
  3. CLR中的IL、CTS和CLS总结
  4. IT运维管理员如何写好一份年终总结?
  5. GeoServer之styles定制
  6. 对身体的挣脱与自足的想象:谈阿满的小说集《双花祭》
  7. Java 队列清空,如何清空Actor死信队列 - java
  8. python数据分析环境搭建_教你零搭建Python数据分析环境
  9. socket 函数 setsockopt()用法
  10. java--方法重写与重载
  11. bzoj1096 [ZJOI2007]仓库建设(斜率)
  12. 深度|常见IT人才外包存在的问题及解决建议
  13. 解决[“usingcomponents“][“van-button“]: “@vant/weapp/button/index“ 未找到:
  14. 隐私保护的数据挖掘综述
  15. JavaScript百炼成仙 函数七重关之三(参数传递)
  16. 光荣与梦想:Uniswap的2020回顾和2021展望
  17. 微信小程序订阅消息功能
  18. FreeRTOS系统定时器任务的实现
  19. 【python作业】编写一个函数,由实参传来一个字符串,统计此字符串中字母和数字的个数,在主函数中输入字符串并输出上述的结果。
  20. java对接顺丰(丰桥)官方接口查询物流附小程序物流模板

热门文章

  1. 介绍个好点的,JAVA技术群
  2. EasyUI 验证框使用方法
  3. ubuntu在VMware虚拟机安装了后桌面显示问题
  4. cropbox.js 头像裁剪插件
  5. 如何使用WebUploader。
  6. IIS Tomcat共享80端口
  7. LinkedList 源码小解
  8. 如何修改opencart的模版适合为mycncart系统使用
  9. 百度Android开发面试题
  10. ASP用正则验证邮箱地址手机号码电话号码格式