转载自https://blog.csdn.net/The_lastest/article/details/78357727?locationNum=9&fps=1

学习曲线(learning curve)是将训练集误差和交叉验证集误差作为训练集实例数量(m)的函数绘制的图表
一个能有效帮助我们分析训练模型是否出现问题的工具。

1、高偏差的学习曲线

从这个曲线我们可以看到:

当m很小的时候,Jtrain(θ)也很小,因为很容易就能拟合(甚至过拟合),但用这个训练好的模型在验证集上来验证,就会出现很差的效果Jcv(θ)异常的大;随着m的增大,Jtrain(θ)开始增大,Jcv(θ)开始减小;当m越来越大的时候,Jcv(θ)也越来越小,也就是说明模型的泛化程度越来越好;但随着m的增大,Jtrain(θ)也迅速增大,然后超过了最优值,虽然Jcv(θ)也在一直减少,但是始终不会达到最优状态且离最优值很远,故而出现高偏差。所以,如果一个模型如果出现了高偏差的话,增加训练集的数量就没有作用了。

2、高方差的学习曲线

当m较小时,同上面一样;随着m的增大,Jcv(θ)也逐渐变小,也就是说明模型的泛化程度越来越好;当m越来越大时,Jtrain(θ)的虽然持续在增长,但是几乎出现了停滞,很靠近最优的情况;且随着m的增长模型的泛化能力一直在增强,但同样增长得比较缓慢,故而出现了高方差。所以,如果一个模型如果出现了高方差的话,增加训练集的数量仍可以提高模型的性能。

3、总结

在高偏差/欠拟合的情况下,增加数据到训练集不一定能有帮助

在高方差/过拟合的情况下,增加更多数据到训练集可能可以提高算法效果

机器学习(吴恩达)笔记——高偏差高方差相关推荐

  1. 机器学习-吴恩达-笔记-7-机器学习系统的设计

    目录 误差分析 类偏斜的误差度量 查准率和查全率之间的权衡 机器学习的数据 [此为本人学习吴恩达的机器学习课程的笔记记录,有错误请指出!] 误差分析 在本次课程中,我们将会讲到误差分析( Error ...

  2. 机器学习-吴恩达-笔记-14-应用实例:图片文字识别

    目录 问题描述和流程图 滑动窗口 获取大量数据和人工数据 上限分析:哪部分管道得接下去做 [此为本人学习吴恩达的机器学习课程的笔记记录,有错误请指出!] 问题描述和流程图 图像文字识别应用,是从一张给 ...

  3. 机器学习-吴恩达-笔记-6-应用机器学习的建议

    目录 评估一个假设(假设函数) 模型选择和交叉验证集 诊断偏差和方差 正则化和偏差/方差 学习曲线 决定下一步做什么 [此为本人学习吴恩达的机器学习课程的笔记记录,有错误请指出!] 当我们运用训练好了 ...

  4. 机器学习-吴恩达-笔记-15-总结

    [此为本人学习吴恩达的机器学习课程的笔记记录,有错误请指出!] 机器学习是一门对科技.工业产生深远影响的重要学科. 机器学习的理论知识:微积分.线性代数.统计学.信息论等. 机器学习的实践框架:PyT ...

  5. 机器学习-吴恩达-笔记-13-大规模机器学习

    目录 大型数据集的学习 批量梯度下降 随机梯度下降 小批量梯度下降 随机梯度下降收敛 在线学习 映射化简和数据并行 [此为本人学习吴恩达的机器学习课程的笔记记录,有错误请指出!] 大型数据集的学习 如 ...

  6. 机器学习-吴恩达-笔记-12-推荐系统

    目录 问题形式化 基于内容的推荐系统 协同过滤 向量化:低秩矩阵分解 推行工作上的细节:均值归一化 基于相似内容推荐和基于相似用户推荐(个人扩展) [此为本人学习吴恩达的机器学习课程的笔记记录,有错误 ...

  7. 机器学习-吴恩达-笔记-11-异常检测

    目录 问题的动机 高斯分布 算法 开发和评价一个异常检测系统 异常检测与监督学习对比 选择特征 多元高斯分布 使用多元高斯分布进行异常检测 [此为本人学习吴恩达的机器学习课程的笔记记录,有错误请指出! ...

  8. 机器学习-吴恩达-笔记-10-降维

    目录 动机一:数据压缩 动机二:数据可视化 主成分分析问题 主成分分析算法 主成分分析的数量(选择k值) 重建的压缩表示(从低维还原回高维) 主成分分析法的应用建议 [此为本人学习吴恩达的机器学习课程 ...

  9. 机器学习-吴恩达-笔记-9-聚类

    目录 无监督学习:简介 K-均值算法(K-Means) 优化目标 随机初始化 选择聚类数 相似度/距离计算方法 聚类的衡量指标 [此为本人学习吴恩达的机器学习课程的笔记记录,有错误请指出!] 无监督学 ...

  10. 机器学习-吴恩达-笔记-8-支持向量机

    目录 优化目标 大边界的直观理解 大边界分类背后的数学 核函数-1 核函数-2 使用支持向量机 [此为本人学习吴恩达的机器学习课程的笔记记录,有错误请指出!] 优化目标 为了描述支持向量机,我们将会从 ...

最新文章

  1. 从零实现 SpringBoot 简易读写分离,也不难嘛!
  2. Mysql:Sql的执行顺序
  3. Linux shell 进制转换
  4. dtrace-stap-book
  5. python3 有序字典
  6. Android 8.0学习 (36)---Android 8.0 WebView 拍照、简易预览、二维码扫描 各种问题解决
  7. 【树莓派搭建个人网站】WordPress安装
  8. 使用jvisualvm通过JMX的方式监控远程JVM运行状况
  9. 区块链 以太坊 合约 创建、执行 详解
  10. 尚硅谷SpringCloud Alibaba
  11. iOS程序员自述,从月入10k到年薪百万,移动架构师如何养成的?
  12. 银联支付接口申请-手机控件支付
  13. 微信小程序实现组件之间的传值
  14. 形式化验证工具——prism(1-安装)
  15. Qt编写的知名的开源软件汇总
  16. 如何通过阿里云APP进行域名备案?阿里云备案流程需要多久?
  17. CSAPP:BombLab 详细解析
  18. Android开发-WebView中实现Android调用JS JS调用Android 【三】
  19. Python3 基础知识
  20. 猫眼电影某页面动态字体bypass

热门文章

  1. 【算法】素数(质数)判断方法
  2. uniapp如何调用手机相机进行拍照
  3. 基于STM32F429的SDRAM使用
  4. 安装window service 中出现Set Service Login对话框
  5. 成都python运维工程师待遇_什么样的运维工程师薪水较高, 你知道吗?
  6. 图形驱动程序和显卡驱动什么区别_3D建模和渲染是吃CPU还是显卡?及专业图形显卡和游戏显卡的区别...
  7. Android直播头像动画,Android 抖音头像缩放特效 直播间特效 100%高度还原
  8. 织梦安装或迁移后无法更新栏目HTML,报错无法完成请求
  9. ​2022年第112期(Radiology): 肿瘤免疫治疗影像学的新概念和发展变化
  10. “智慧”政务更高效 MapGIS自然资源政务服务信息化平台