吴恩达机器学习-第六周
本周主要内容
- 1.模型选择和交叉验证集
- 2.诊断偏差和方差
- 3.学习曲线
- 4.机器学习系统的设计
1.模型选择和交叉验证集
数据分为:训练集,交叉验证集,测试集
- 使用训练集练出多个模型
- 对多个模型分别用交叉验证集得出交叉验证误差(代价函数的值)
- 选取代价函数值最小的模型
- 使用3中选出的模型计算代价函数
2.诊断偏差和方差
训练集误差和交叉验证集误差近似时:偏差/欠拟合
交叉验证集误差远大于训练集误差时:方差/过拟合
应对方法:正则化
3.学习曲线
高偏差的/欠拟合的情况下,增加数据到训练集不一定有帮助。
高方差/过拟合的情况下,增加更多的数据可能提高算法的效果。
解决高方差:
- 获得更多的训练集
- 减少特征数量
- 增加正则化程度λ\lambdaλ
解决高偏差:
- 增加特征数量
- 增加多项式特征
- 减少正则化程度λ\lambdaλ
4.机器学习系统的设计
- 从简单快速的算法开始,实现算法并且交叉验证
- 绘制学习曲线算法,
- 误差分析
偏斜类(skewed classes)
查准率 precision:预测为真的实例是不是真的是真的
查全率 recall:预测为真的实例占所有真的是真的的实例的个数
- 正确肯定TP 预测为真,实际为真
- 正确否定TN 预测为假,实际为假
- 错误肯定FP 预测为真,实际为假
- 错误否定FN 预测为假,实际为真
查准率 P = TPTP+FP{TP} \over {TP+FP}TP+FPTP
查全率 R = TPTP+FN{TP} \over {TP+FN}TP+FNTP
权衡查准率与查全率的方法,计算F1值(F1 score)F1值越高一般来说模型越好F1score=2PRP+RF1 score ={ {2PR} \over {P+R}} F1score=P+R2PR
吴恩达机器学习-第六周相关推荐
- python第六周实验_机器学习 | 吴恩达机器学习第六周编程作业(Python版)
实验指导书 下载密码:ovyt 本篇博客主要讲解,吴恩达机器学习第六周的编程作业,作业内容主要是实现一个正则化的线性回归算法,涉及本周讲的模型选择问题,绘制学习曲线判断高偏差/高方差问题.原始实 ...
- 机器学习 | 吴恩达机器学习第六周编程作业(Python版)
实验指导书 下载密码:ovyt 本篇博客主要讲解,吴恩达机器学习第六周的编程作业,作业内容主要是实现一个正则化的线性回归算法,涉及本周讲的模型选择问题,绘制学习曲线判断高偏差/高方差问题.原始实 ...
- 吴恩达机器学习笔记第一周
第一周 吴恩达机器学习笔记第一周 一. 引言(Introduction) 1.1 欢迎 1.2 机器学习是什么? 1.3 监督学习 1.4 无监督学习 二.单变量线性回归(Linear Regress ...
- 吴恩达机器学习(六)神经网络(前向传播)
目录 0. 前言 1. 神经网络模型 2. 前向传播(forward propagation) 3. 神经网络中的多分类 学习完吴恩达老师机器学习课程的神经网络,简单的做个笔记.文中部分描述属于个人消 ...
- 吴恩达机器学习——第三周学习笔记
二元分类(Binary Classfication) 分类,一种方法是使用线性回归,将所有大于0.5的预测映射为1,将所有小于0.5的预测映射为0.然而,这种方法并不能很好地工作,因为分类实际上不是一 ...
- 【吴恩达机器学习】第二周课程精简笔记——多元线性回归和计算参数分析
1. Multivariate Linear Regerssion(多元线性回归) (1)Multiple Feature We now introduce notation for equation ...
- 西瓜书+实战+吴恩达机器学习(六)监督学习之逻辑回归 Logistic Regression
文章目录 0. 前言 1. 逻辑回归参数求解方法 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~ 0. 前言 逻辑回归,根据数据对分类边界进行回归,以此分类. y=σ(wTx ...
- 吴恩达机器学习第十周测试
第一题 答案 B 分析:当代价函数呈上升趋势的时候,可以试着将学习率减小 第二题 答案 CD 分析: A:随机梯度下降并不能并行化,错误. B:批量梯度下降是在每一次迭代后计算代价函数,错误. C:在 ...
- (英文版)吴恩达机器学习第三周笔记
Logistic Regression 这是我在coursera上看Andrew Ng的machine learning做的英文版笔记,可以帮助学英语的小伙伴熟悉熟悉一些专业术语在英文中的表达.由于笔 ...
最新文章
- Linux系统下GNU Wget 命令用法详解及其参数说明
- 心疼啊今天在四季青买衣服的时候在试衣服的时候,竟然有个小偷把我的n73手机给偷去了,...
- LeetCode 1181. 前后拼接(哈希map)
- 我们究竟该看待百度更新?
- 解决python访问中突发requests.exceptions.ConnectionError:Max retries exceeded with url报错
- Android 应用开发(8)---语言和语言区域
- 2019厦门大学信息学院人工智能/智能科学与技术系夏令营(非计算机系)
- 增加字库 安卓_【Android】Android4.4添加新语言和字库
- android下拉菜单刷新,android下拉刷新列表实现(pull to refresh)
- 大数据可视化平台优点在哪
- 游戏开发之C++指针的妙用(C++)
- 最完美的matlab绘图教程集合
- 因计算机中丢失msvcr120.dll,msvcr120.dll一键修复工具 | 麦田一棵葱
- 使用CNN实现C-MAPSS数据集里面的剩余寿命预测(Pytorch)
- chrome浏览器使用
- 我们都应该停止三种测试实践
- aruba交换机配置命令_Aruba 无线交换机基本操作命令
- docker开放远程服务
- js获取随机数与随机颜色函数的简单封装
- (转)经典SQL查询语句大全