本系列文档按课程视频的章节(P+第几集)进行分类,记录了学习时的一些知识点,方便自己复习。

课程视频P54

图1 表示求导数的原理。

图1  

图2 将图1推广到有n个参数变量的情况。

图2  

图3 提出了一些注意事项。

图3  

课程视频P55

图4 表示了求导时的一些特殊规律。

图4  

课程视频P56

图5 给出了选择神经网络层数的一些规律,通常中间层的层数要大于等于输入层的特征变量数量。

图5  

** 图6 给出了训练神经网络的操作步骤**

图6  

** 图7 续接了图6 ,给出了训练神经网络的操作步骤:**

图7  

课程视频P58

图8 说明了训练算法时的一些思想误区,不是样本数量越多就越好,更多还是要考虑方法的优异性。

图8  

图9 表示要通过一些诊断方法来及时测试出算法的有效性。

图9  

课程视频P59

当算法的泛化性很差时,训练出的算法只能够在训练数据中取得好的效果,而不能在其他的数据集中适用。

图10  

所以要通过一些测试结果对算法做一个初步判断。

图11  

课程视频P60

通过图12 的思想,不断增加代价函数的项数和最高次数,来测试出哪一次数下的函数效果最好。

图12  

为了更好的测试,我们将数据一分为三,第一部分为训练集(Training set),第二部分为验证集(Cross validation),第三部分为测试集 (Test set)。

图13  

图14 表示了不同样本测试样本集下的代价函数相应的误差。。

图14  

**图15 展示了这样在选择模型的时候,可以先使用测试集得到每个模型的θθ\thetaθθθ,然后使用验证集评估得到误差最小的模型,最后使用测试集评估他的泛化能力。

**

图15  

课程视频P61——偏差和方差

**当多项式次数增大时,训练集的误差慢慢减小,因为多项式次数越高,图像拟合的就越准确。但是验证集不同,它的趋势是先减少后增大,这分别对应着欠拟合和过拟合。
**

图16  

图17 表示我们可以根据误差的不同表现来区分偏差和方差。
当训练误差(Bias)和验证方差(Variance)都很大时,表示高偏差,即表示欠拟合;
当训练误差(Bias)很小,验证方差(Variance)很大时,表示高方差,即表示过拟合。
通过画出图像可以很好的帮助我们判断训练测试的效果。

图17  

课程视频P39——正则化的偏差和方差

通过引入lamdalamdalamda来平衡多形式的权重。
当lambdaλ太大,参数θ\thetaθ≈0,模型近似水平直线,即表示欠拟合。当lambda太小,就会出现过拟合。

图18  

图19 中表示通过将λ\lambdaλ从0.01到10,以每次为上次的2倍的梯度步进,一点点试出最合适的λ\lambdaλ值。

图19  

图20 中通过画出图像可以很好的帮助我们判断训练测试的效果。
当训练误差(Bias)和验证方差(Variance)都很大时,表示高偏差,即表示欠拟合。;
当训练误差(Bias)很小,验证方差(Variance)很大时,表示高方差,即表示过拟合。

图20  

图21 形象的表现为函数过分追求与训练数据去贴合,关注了太多指标,导致泛化(generalize)性比较差。

图21  

如图22 介绍了应对函数过拟合问题的一些办法。

图22  

课程视频P62——代价函数

图23 介绍了“罚因子”,对于目标函数最小化问题,当某些指标对代价函数值的影响很小时,如图23 中的θ3,θ4\theta_3, \theta_4θ3​,θ4​,我们可对其乘以一个很大的数,如此处了1000,作为代价函数的“罚因子”,当θ3,θ4\theta_3, \theta_4θ3​,θ4​过大时,函数值将很难取得最小值,由此保证了在迭代过程中,保持θ3,θ4\theta_3, \theta_4θ3​,θ4​的值很小。

图23  

除了“罚因子”之外,用正规化(regularization)求解时也可以对代价函数加上λ....\lambda....λ....这一坨。

图24  

续接上图

图25  

但是λ....\lambda....λ....的取值也不是乱取的,若λ....\lambda....λ....取得太大了,则相当于与θ1...θn\theta_1...\theta_nθ1​...θn​全都被干掉了,不起作用了,此时只剩下θ1\theta_1θ1​, 于是hθ(x)=θ1,代价函数就变成一条直线了,这样也不行。h_{\theta}(x)=\theta_1,代价函数就变成一条直线了,这样也不行。hθ​(x)=θ1​,代价函数就变成一条直线了,这样也不行。

图26  

课程视频P63——线性回归的正则化

如图27表示,在梯度下降中,求偏导那一步最后加上λm\frac{\lambda}{m}mλ​θj\theta_jθj​, 就相当于在原来的基础上每次开头先将θj\theta_jθj​减去α\alphaαθj\theta_jθj​(一个很小的数。

图27  

加上λm\frac{\lambda}{m}mλ​θj\theta_jθj​, 之后,用矩阵形式求解时的求解公式就变成了如图28所示。

图28  

课程视频P63——Logistic回归的正则化

与线性回归的正则化类似,只是代价函数变成log函数形式了。

图29  

梯度下降法的求解也是与线性回归一样的,只是将hθ(x)h_{\theta}(x)hθ​(x)函数换了,如图30 右下角所示。

图30  

多元函数的梯度下降法的偏导环节如下所示。

图31  

未完待续…

吴恩达机器学习打卡day6相关推荐

  1. 吴恩达机器学习课后作业1——单变量线性回归(Linear regression with one variable)

    1. 问题和数据 假设你是一家连锁餐车店的老板,但是你又和别的土老板不一样,你又刚好是个懂线性回归,还懂编程的老板,正在考虑在不同的城市开一家新店.该连锁店已经在各个城市开设了餐车,你可以获得这些城市 ...

  2. 吴恩达机器学习课后作业1.1——多变量线性回归(Linear regression with multiple variable)

    1. 问题和数据 假设你要卖掉你的房子,你想知道一个好的市场价格是多少.其中一种方法是,首先收集最近出售的房屋的信息.在本部分的练习中,你将使用多元线性回归来预测房屋价格. 数据ex1data2.tx ...

  3. 吴恩达机器学习:week1

    title: 吴恩达机器学习:week1 date: 2019-11-03 17:41:46 categories: 机器学习 tags: 机器学习 第1周 文章目录 第1周 1.1 欢迎 1.2 机 ...

  4. 吴恩达机器学习笔记第一周

    第一周 吴恩达机器学习笔记第一周 一. 引言(Introduction) 1.1 欢迎 1.2 机器学习是什么? 1.3 监督学习 1.4 无监督学习 二.单变量线性回归(Linear Regress ...

  5. 吴恩达机器学习笔记整理(Week6-Week11)

    1. Week 6 1.1 应用机器学习的建议(Advice for Applying Machine Learning) 1.1.1 决定下一步做什么 到目前为止,我们已经介绍了许多不同的学习算法, ...

  6. 吴恩达机器学习之引言:入门、机器学习是什么、监督学习、无监督学习、推荐Octave软件进行开发

    吴恩达机器学习栏目清单 专栏直达:https://blog.csdn.net/qq_35456045/category_9762715.html 文章目录 引言(Introduction) 1.1 欢 ...

  7. 【CV】吴恩达机器学习课程笔记 | 第1-2章

    本系列文章如果没有特殊说明,正文内容均解释的是文字上方的图片 机器学习 | Coursera 吴恩达机器学习系列课程_bilibili 目录 1 介绍 1-3 监督学习 1-4 无监督学习 2 单变量 ...

  8. 【CV】吴恩达机器学习课程笔记第18章

    本系列文章如果没有特殊说明,正文内容均解释的是文字上方的图片 机器学习 | Coursera 吴恩达机器学习系列课程_bilibili 目录 18 应用案例:照片OCR 18-1 问题描述与流程(pi ...

  9. 【CV】吴恩达机器学习课程笔记第17章

    本系列文章如果没有特殊说明,正文内容均解释的是文字上方的图片 机器学习 | Coursera 吴恩达机器学习系列课程_bilibili 目录 17 大规模机器学习 17-1 学习大数据集 17-2 随 ...

  10. 【CV】吴恩达机器学习课程笔记第16章

    本系列文章如果没有特殊说明,正文内容均解释的是文字上方的图片 机器学习 | Coursera 吴恩达机器学习系列课程_bilibili 目录 16 推荐系统 16-1 问题规划 16-2 基于内容的推 ...

最新文章

  1. 普通人也能用AI拍出3D大片?这位清华博士后这么做
  2. php井字游戏,python实现井字棋游戏
  3. nebula注释符号
  4. 这几个GraphPad Prism使用的小技巧让你绘图效率直接翻倍
  5. springboot的自动配置原理
  6. HDU 5878 I Count Two Three
  7. python官方帮助文档中文版-python中文版
  8. Bartender条码打印软件,提示30天以后该软件将会过期
  9. C语言实现扫雷游戏完整代码
  10. GPS从入门到放弃(一) --- GPS基础原理
  11. Apache是干什么的?
  12. 【内部流出,勿做商用】今日教大家如何抢聚划算
  13. python 存根_python - 内联类型注释与存根会导致不同的mypy行为 - SO中文参考 - www.soinside.com...
  14. html是什么简答题,网页设计与制作简答题.doc
  15. 讯飞语音输入法linux,讯飞语音输入法逆天了
  16. ctf之crypto练习二
  17. No overload matches this call. Overload 1 of 2, ‘(type: “*“, handler: WildcardHandler<Record<EventTy
  18. Fiddler 抓包HTTPS包,抓手机包
  19. Win10 批量修改文件名
  20. java tika pdf_TIKA提取PDF

热门文章

  1. 刘兴亮 -- IT博客-中国最具人气的IT博客-赛迪网IT人家园
  2. 浏览器出现ERR_PROXY_CONNECTION_FAILED 错误代码
  3. 系统安装部署系列教程(六):封装系统
  4. OpenAI 开源语音识别模型 Whisper 初体验
  5. siteground主机黑五优惠最低2折-2.99美元每月-vps主机-WordPress主机服务器
  6. ShowWindow的nCmdShow参数列表
  7. 云更新网吧系统服务器,云更新2021最新版安装视频教程/网吧无盘系统/万能包PNP驱动...
  8. 高并发之阿里云弹性伸缩的使用记录
  9. 简单的网站全屏背景图代码
  10. java中applet下载,Java Applet概述