本周主要内容

  • 1.模型选择和交叉验证集
  • 2.诊断偏差和方差
  • 3.学习曲线
  • 4.机器学习系统的设计

1.模型选择和交叉验证集

数据分为:训练集,交叉验证集,测试集

  1. 使用训练集练出多个模型
  2. 对多个模型分别用交叉验证集得出交叉验证误差(代价函数的值)
  3. 选取代价函数值最小的模型
  4. 使用3中选出的模型计算代价函数

2.诊断偏差和方差

训练集误差和交叉验证集误差近似时:偏差/欠拟合
交叉验证集误差远大于训练集误差时:方差/过拟合

应对方法:正则化

3.学习曲线


高偏差的/欠拟合的情况下,增加数据到训练集不一定有帮助。
高方差/过拟合的情况下,增加更多的数据可能提高算法的效果。

解决高方差:

  • 获得更多的训练集
  • 减少特征数量
  • 增加正则化程度λ\lambdaλ

解决高偏差:

  • 增加特征数量
  • 增加多项式特征
  • 减少正则化程度λ\lambdaλ

4.机器学习系统的设计

  1. 从简单快速的算法开始,实现算法并且交叉验证
  2. 绘制学习曲线算法,
  3. 误差分析

偏斜类(skewed classes)
查准率 precision:预测为真的实例是不是真的是真的
查全率 recall:预测为真的实例占所有真的是真的的实例的个数

  • 正确肯定TP 预测为真,实际为真
  • 正确否定TN 预测为假,实际为假
  • 错误肯定FP 预测为真,实际为假
  • 错误否定FN 预测为假,实际为真

查准率 P = TPTP+FP{TP} \over {TP+FP}TP+FPTP​

查全率 R = TPTP+FN{TP} \over {TP+FN}TP+FNTP​

权衡查准率与查全率的方法,计算F1值(F1 score)F1值越高一般来说模型越好F1score=2PRP+RF1 score ={ {2PR} \over {P+R}} F1score=P+R2PR​

吴恩达机器学习-第六周相关推荐

  1. python第六周实验_机器学习 | 吴恩达机器学习第六周编程作业(Python版)

    实验指导书    下载密码:ovyt 本篇博客主要讲解,吴恩达机器学习第六周的编程作业,作业内容主要是实现一个正则化的线性回归算法,涉及本周讲的模型选择问题,绘制学习曲线判断高偏差/高方差问题.原始实 ...

  2. 机器学习 | 吴恩达机器学习第六周编程作业(Python版)

    实验指导书    下载密码:ovyt 本篇博客主要讲解,吴恩达机器学习第六周的编程作业,作业内容主要是实现一个正则化的线性回归算法,涉及本周讲的模型选择问题,绘制学习曲线判断高偏差/高方差问题.原始实 ...

  3. 吴恩达机器学习笔记第一周

    第一周 吴恩达机器学习笔记第一周 一. 引言(Introduction) 1.1 欢迎 1.2 机器学习是什么? 1.3 监督学习 1.4 无监督学习 二.单变量线性回归(Linear Regress ...

  4. 吴恩达机器学习(六)神经网络(前向传播)

    目录 0. 前言 1. 神经网络模型 2. 前向传播(forward propagation) 3. 神经网络中的多分类 学习完吴恩达老师机器学习课程的神经网络,简单的做个笔记.文中部分描述属于个人消 ...

  5. 吴恩达机器学习——第三周学习笔记

    二元分类(Binary Classfication) 分类,一种方法是使用线性回归,将所有大于0.5的预测映射为1,将所有小于0.5的预测映射为0.然而,这种方法并不能很好地工作,因为分类实际上不是一 ...

  6. 【吴恩达机器学习】第二周课程精简笔记——多元线性回归和计算参数分析

    1. Multivariate Linear Regerssion(多元线性回归) (1)Multiple Feature We now introduce notation for equation ...

  7. 西瓜书+实战+吴恩达机器学习(六)监督学习之逻辑回归 Logistic Regression

    文章目录 0. 前言 1. 逻辑回归参数求解方法 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~ 0. 前言 逻辑回归,根据数据对分类边界进行回归,以此分类. y=σ(wTx ...

  8. 吴恩达机器学习第十周测试

    第一题 答案 B 分析:当代价函数呈上升趋势的时候,可以试着将学习率减小 第二题 答案 CD 分析: A:随机梯度下降并不能并行化,错误. B:批量梯度下降是在每一次迭代后计算代价函数,错误. C:在 ...

  9. (英文版)吴恩达机器学习第三周笔记

    Logistic Regression 这是我在coursera上看Andrew Ng的machine learning做的英文版笔记,可以帮助学英语的小伙伴熟悉熟悉一些专业术语在英文中的表达.由于笔 ...

最新文章

  1. Linux系统下GNU Wget 命令用法详解及其参数说明
  2. 心疼啊今天在四季青买衣服的时候在试衣服的时候,竟然有个小偷把我的n73手机给偷去了,...
  3. LeetCode 1181. 前后拼接(哈希map)
  4. 我们究竟该看待百度更新?
  5. 解决python访问中突发requests.exceptions.ConnectionError:Max retries exceeded with url报错
  6. Android 应用开发(8)---语言和语言区域
  7. 2019厦门大学信息学院人工智能/智能科学与技术系夏令营(非计算机系)
  8. 增加字库 安卓_【Android】Android4.4添加新语言和字库
  9. android下拉菜单刷新,android下拉刷新列表实现(pull to refresh)
  10. 大数据可视化平台优点在哪
  11. 游戏开发之C++指针的妙用(C++)
  12. 最完美的matlab绘图教程集合
  13. 因计算机中丢失msvcr120.dll,msvcr120.dll一键修复工具 | 麦田一棵葱
  14. 使用CNN实现C-MAPSS数据集里面的剩余寿命预测(Pytorch)
  15. chrome浏览器使用
  16. 我们都应该停止三种测试实践
  17. aruba交换机配置命令_Aruba 无线交换机基本操作命令
  18. docker开放远程服务
  19. js获取随机数与随机颜色函数的简单封装
  20. (转)经典SQL查询语句大全

热门文章

  1. 苹果电脑mac安装nginx教程
  2. 网络算法学习——RCNN理论解读
  3. 京东618推RFID防伪认证平台 对多品类商品进行防伪溯源认证
  4. 一键分享QQ微信html,网页分享插件,可以实现微信、QQ、微博分享
  5. 习题11-1 网页跳转 uva821
  6. 华为数通2022年11月 HCIP-Datacom-H12-821 第二章
  7. 现学实用计算机技能,让计算机课堂中的技能学习达到自动化状态
  8. polyglot:Pipeline 多语言NLP工具
  9. 如何用计算机模拟光的传播,介质光波导的模式特性及计算机辅助分析的研究
  10. 域名可以永久使用吗?