吴恩达机器学习打卡day6
本系列文档按课程视频的章节(P+第几集)进行分类,记录了学习时的一些知识点,方便自己复习。
课程视频P54
图1 表示求导数的原理。
图1
图2 将图1推广到有n个参数变量的情况。
图2
图3 提出了一些注意事项。
图3
课程视频P55
图4 表示了求导时的一些特殊规律。
图4
课程视频P56
图5 给出了选择神经网络层数的一些规律,通常中间层的层数要大于等于输入层的特征变量数量。
图5
** 图6 给出了训练神经网络的操作步骤**
图6
** 图7 续接了图6 ,给出了训练神经网络的操作步骤:**
图7
课程视频P58
图8 说明了训练算法时的一些思想误区,不是样本数量越多就越好,更多还是要考虑方法的优异性。
图8
图9 表示要通过一些诊断方法来及时测试出算法的有效性。
图9
课程视频P59
当算法的泛化性很差时,训练出的算法只能够在训练数据中取得好的效果,而不能在其他的数据集中适用。
图10
所以要通过一些测试结果对算法做一个初步判断。
图11
课程视频P60
通过图12 的思想,不断增加代价函数的项数和最高次数,来测试出哪一次数下的函数效果最好。
图12
为了更好的测试,我们将数据一分为三,第一部分为训练集(Training set),第二部分为验证集(Cross validation),第三部分为测试集 (Test set)。
图13
图14 表示了不同样本测试样本集下的代价函数相应的误差。。
图14
**图15 展示了这样在选择模型的时候,可以先使用测试集得到每个模型的θθ\thetaθθθ,然后使用验证集评估得到误差最小的模型,最后使用测试集评估他的泛化能力。
**
图15
课程视频P61——偏差和方差
**当多项式次数增大时,训练集的误差慢慢减小,因为多项式次数越高,图像拟合的就越准确。但是验证集不同,它的趋势是先减少后增大,这分别对应着欠拟合和过拟合。
**
图16
图17 表示我们可以根据误差的不同表现来区分偏差和方差。
当训练误差(Bias)和验证方差(Variance)都很大时,表示高偏差,即表示欠拟合;
当训练误差(Bias)很小,验证方差(Variance)很大时,表示高方差,即表示过拟合。
通过画出图像可以很好的帮助我们判断训练测试的效果。
图17
课程视频P39——正则化的偏差和方差
通过引入lamdalamdalamda来平衡多形式的权重。
当lambdaλ太大,参数θ\thetaθ≈0,模型近似水平直线,即表示欠拟合。当lambda太小,就会出现过拟合。
图18
图19 中表示通过将λ\lambdaλ从0.01到10,以每次为上次的2倍的梯度步进,一点点试出最合适的λ\lambdaλ值。
图19
图20 中通过画出图像可以很好的帮助我们判断训练测试的效果。
当训练误差(Bias)和验证方差(Variance)都很大时,表示高偏差,即表示欠拟合。;
当训练误差(Bias)很小,验证方差(Variance)很大时,表示高方差,即表示过拟合。
图20
图21 形象的表现为函数过分追求与训练数据去贴合,关注了太多指标,导致泛化(generalize)性比较差。
图21
如图22 介绍了应对函数过拟合问题的一些办法。
图22
课程视频P62——代价函数
图23 介绍了“罚因子”,对于目标函数最小化问题,当某些指标对代价函数值的影响很小时,如图23 中的θ3,θ4\theta_3, \theta_4θ3,θ4,我们可对其乘以一个很大的数,如此处了1000,作为代价函数的“罚因子”,当θ3,θ4\theta_3, \theta_4θ3,θ4过大时,函数值将很难取得最小值,由此保证了在迭代过程中,保持θ3,θ4\theta_3, \theta_4θ3,θ4的值很小。
图23
除了“罚因子”之外,用正规化(regularization)求解时也可以对代价函数加上λ....\lambda....λ....这一坨。
图24
续接上图
图25
但是λ....\lambda....λ....的取值也不是乱取的,若λ....\lambda....λ....取得太大了,则相当于与θ1...θn\theta_1...\theta_nθ1...θn全都被干掉了,不起作用了,此时只剩下θ1\theta_1θ1, 于是hθ(x)=θ1,代价函数就变成一条直线了,这样也不行。h_{\theta}(x)=\theta_1,代价函数就变成一条直线了,这样也不行。hθ(x)=θ1,代价函数就变成一条直线了,这样也不行。
图26
课程视频P63——线性回归的正则化
如图27表示,在梯度下降中,求偏导那一步最后加上λm\frac{\lambda}{m}mλθj\theta_jθj, 就相当于在原来的基础上每次开头先将θj\theta_jθj减去α\alphaαθj\theta_jθj(一个很小的数。
图27
加上λm\frac{\lambda}{m}mλθj\theta_jθj, 之后,用矩阵形式求解时的求解公式就变成了如图28所示。
图28
课程视频P63——Logistic回归的正则化
与线性回归的正则化类似,只是代价函数变成log函数形式了。
图29
梯度下降法的求解也是与线性回归一样的,只是将hθ(x)h_{\theta}(x)hθ(x)函数换了,如图30 右下角所示。
图30
多元函数的梯度下降法的偏导环节如下所示。
图31
未完待续…
吴恩达机器学习打卡day6相关推荐
- 吴恩达机器学习课后作业1——单变量线性回归(Linear regression with one variable)
1. 问题和数据 假设你是一家连锁餐车店的老板,但是你又和别的土老板不一样,你又刚好是个懂线性回归,还懂编程的老板,正在考虑在不同的城市开一家新店.该连锁店已经在各个城市开设了餐车,你可以获得这些城市 ...
- 吴恩达机器学习课后作业1.1——多变量线性回归(Linear regression with multiple variable)
1. 问题和数据 假设你要卖掉你的房子,你想知道一个好的市场价格是多少.其中一种方法是,首先收集最近出售的房屋的信息.在本部分的练习中,你将使用多元线性回归来预测房屋价格. 数据ex1data2.tx ...
- 吴恩达机器学习:week1
title: 吴恩达机器学习:week1 date: 2019-11-03 17:41:46 categories: 机器学习 tags: 机器学习 第1周 文章目录 第1周 1.1 欢迎 1.2 机 ...
- 吴恩达机器学习笔记第一周
第一周 吴恩达机器学习笔记第一周 一. 引言(Introduction) 1.1 欢迎 1.2 机器学习是什么? 1.3 监督学习 1.4 无监督学习 二.单变量线性回归(Linear Regress ...
- 吴恩达机器学习笔记整理(Week6-Week11)
1. Week 6 1.1 应用机器学习的建议(Advice for Applying Machine Learning) 1.1.1 决定下一步做什么 到目前为止,我们已经介绍了许多不同的学习算法, ...
- 吴恩达机器学习之引言:入门、机器学习是什么、监督学习、无监督学习、推荐Octave软件进行开发
吴恩达机器学习栏目清单 专栏直达:https://blog.csdn.net/qq_35456045/category_9762715.html 文章目录 引言(Introduction) 1.1 欢 ...
- 【CV】吴恩达机器学习课程笔记 | 第1-2章
本系列文章如果没有特殊说明,正文内容均解释的是文字上方的图片 机器学习 | Coursera 吴恩达机器学习系列课程_bilibili 目录 1 介绍 1-3 监督学习 1-4 无监督学习 2 单变量 ...
- 【CV】吴恩达机器学习课程笔记第18章
本系列文章如果没有特殊说明,正文内容均解释的是文字上方的图片 机器学习 | Coursera 吴恩达机器学习系列课程_bilibili 目录 18 应用案例:照片OCR 18-1 问题描述与流程(pi ...
- 【CV】吴恩达机器学习课程笔记第17章
本系列文章如果没有特殊说明,正文内容均解释的是文字上方的图片 机器学习 | Coursera 吴恩达机器学习系列课程_bilibili 目录 17 大规模机器学习 17-1 学习大数据集 17-2 随 ...
- 【CV】吴恩达机器学习课程笔记第16章
本系列文章如果没有特殊说明,正文内容均解释的是文字上方的图片 机器学习 | Coursera 吴恩达机器学习系列课程_bilibili 目录 16 推荐系统 16-1 问题规划 16-2 基于内容的推 ...
最新文章
- 普通人也能用AI拍出3D大片?这位清华博士后这么做
- php井字游戏,python实现井字棋游戏
- nebula注释符号
- 这几个GraphPad Prism使用的小技巧让你绘图效率直接翻倍
- springboot的自动配置原理
- HDU 5878 I Count Two Three
- python官方帮助文档中文版-python中文版
- Bartender条码打印软件,提示30天以后该软件将会过期
- C语言实现扫雷游戏完整代码
- GPS从入门到放弃(一) --- GPS基础原理
- Apache是干什么的?
- 【内部流出,勿做商用】今日教大家如何抢聚划算
- python 存根_python - 内联类型注释与存根会导致不同的mypy行为 - SO中文参考 - www.soinside.com...
- html是什么简答题,网页设计与制作简答题.doc
- 讯飞语音输入法linux,讯飞语音输入法逆天了
- ctf之crypto练习二
- No overload matches this call. Overload 1 of 2, ‘(type: “*“, handler: WildcardHandler<Record<EventTy
- Fiddler 抓包HTTPS包,抓手机包
- Win10 批量修改文件名
- java tika pdf_TIKA提取PDF
热门文章
- 刘兴亮 -- IT博客-中国最具人气的IT博客-赛迪网IT人家园
- 浏览器出现ERR_PROXY_CONNECTION_FAILED 错误代码
- 系统安装部署系列教程(六):封装系统
- OpenAI 开源语音识别模型 Whisper 初体验
- siteground主机黑五优惠最低2折-2.99美元每月-vps主机-WordPress主机服务器
- ShowWindow的nCmdShow参数列表
- 云更新网吧系统服务器,云更新2021最新版安装视频教程/网吧无盘系统/万能包PNP驱动...
- 高并发之阿里云弹性伸缩的使用记录
- 简单的网站全屏背景图代码
- java中applet下载,Java Applet概述