目录

0. 前言

1. 正则化(Regularization)

2. 线性回归中的正则化

3. 逻辑回归中的正则化


学习完吴恩达老师机器学习课程的正则化,简单的做个笔记。文中部分描述属于个人消化后的理解,仅供参考。

如果这篇文章对你有一点小小的帮助,请给个关注喔~我会非常开心的~

0. 前言

在分类或者回归时,通常存在两个问题,“过拟合”(overfitting)和“欠拟合”(underfitting).

  • 过拟合:曲线为了减少代价函数,一味地拟合数据,使得样本中几乎每一个数据都能正确被分类(回归),导致过度拟合,不能泛化新的样本,通常具有高方差(high variance)
  • 欠拟合:曲线的拟合度不够,太多的数据并没有被拟合到,通常具有高偏差(high bias)

通常,在过拟合的情况中,存在过量的特征,有以下两种解决办法:

  • 减少特征量
  • 采用正则化

1. 正则化(Regularization)

由于造成过拟合的原因可能是太多的特征量,所以可采用减少特征量的方法。但是不妨换种思路,减少特征量的权值(这个特征乘以的  很小),来达到目的。

例如,对于 ,已知  的关联度不大,我们需要减少它的权值(),可将代价函数修改为 ,这样为了降低 ,就会使得 ,达到了减小特征的目的。

但是通常,我们不知道哪些特征量是无关的,所以给出修改后的代价函数定义:

其中, 称为正则化参数, 称为正则项,目的是使得  减小。正则化使得假设函数更加简单,减小发生过拟合概率。

注:如果  过大,会造成 ,使得 ,造成欠拟合。

2. 线性回归中的正则化

在线性回归中运用正则化,我们已知代价函数和梯度下降法如下定义:

代入可得:

其中,,所以相当于  乘以一定的权值,然后再减去梯度下降的变化量。

同样,在正规方程中,也可以使用正则化:

此时,可以保证,中间项一定不是奇异矩阵,一定存在逆矩阵。

3. 逻辑回归中的正则化

与上述类似,代价函数可表示为:

梯度下降法可表示为:

逻辑回归中的  是在  外包裹了一层  函数的,与线性回归不同,所以梯度下降法看似相同却不同。


如果这篇文章对你有一点小小的帮助,请给个关注喔~我会非常开心的~

吴恩达机器学习(五)正则化(解决过拟合问题)相关推荐

  1. 吴恩达——机器学习(正则化Regularization)

    正则化 Regularization 1.过拟合 overfitting eg1:线性回归 图一:欠拟合,高偏差 图三:过拟合,高方差(一般在变量很多的时候发生,这种时候训练出的方程总能很好拟合训练数 ...

  2. 吴恩达机器学习(十七)过拟合、正则化下的代价函数

    文章目录 1.过拟合 2.正则化下的代价函数 1.过拟合   包插线性回归和逻辑回归等的几种学习算法能够有效解决许多问题,但是当它们应用到某些特定的机器学习应用时,会遇到过度拟合的问题,导致它们表现欠 ...

  3. 吴恩达机器学习 5.正则化

    1.理解过拟合问题 在训练集的基础上用模型去拟合,得到的假设可能能够非常好地适应训练集(代价函数可能几乎为0,即最小化J(θ)J(\theta)J(θ)几乎为0),但是可能会不能推广到新的数据. 举例 ...

  4. 吴恩达机器学习(五)逻辑回归练习-二分类练习

    1.基础内容 (1)公式总结: (2)内容回归: 逻辑回归主要是进行二分类和多分类. 二分类中,分为线性可分和线性不可分. 对于线性回归模型,我们定义的代价函数是所有模型误差的平方和.理论上来说,我们 ...

  5. 带你少走弯路:五篇文章学完吴恩达机器学习

    本文是吴恩达老师的机器学习课程[1]的笔记和代码复现部分,这门课是经典,没有之一.但是有个问题,就是内容较多,有些内容确实有点过时. 如何在最短时间学完这门课程?作为课程的主要翻译者和笔记作者,我推荐 ...

  6. 吴恩达机器学习作业Python实现(五):偏差和方差

    吴恩达机器学习系列作业目录 在本练习中,您将实现正则化的线性回归和多项式回归,并使用它来研究具有不同偏差-方差属性的模型 1 Regularized Linear Regression 正则线性回归 ...

  7. 【吴恩达机器学习】第五周课程精简笔记——代价函数和反向传播

    Cost Function and Backpropagation(代价函数和反向传播) 1. Cost Function Let's first define a few variables tha ...

  8. 吴恩达机器学习(十一)—— 应用机器学习的建议

    吴恩达机器学习系列内容的学习目录 → \rightarrow →吴恩达机器学习系列内容汇总. 1. 决定下一步做什么 2. 评估假设函数 3. 模型选择和训练.验证.测试集 4. 诊断偏差和方差 5. ...

  9. 吴恩达机器学习笔记(自用)

    吴恩达机器学习 机器学习的定义 什么是机器学习? 机器学习算法 1.监督学习(Supervised Learning) 2.无监督学习(Unsupervised Learning) 单变量线性回归 模 ...

  10. 【CV】吴恩达机器学习课程笔记第10章

    本系列文章如果没有特殊说明,正文内容均解释的是文字上方的图片 机器学习 | Coursera 吴恩达机器学习系列课程_bilibili 目录 10 应用机器学习的建议 10-1 决定下一步做什么 10 ...

最新文章

  1. php改7z,PHP的7z扩展名? - php
  2. nfs服务端服务停掉,导致的客户端访问挂载目录卡死的情况
  3. 《从零开始学Swift》学习笔记(Day 6)——哎呀常量和变量都该什么时候用啊?...
  4. 用gnuplot画出c产生数据的波形图
  5. 【远程操控】Pycharm远程连接服务器之本地显示独立的plot窗口
  6. Lock同步锁--线程同步
  7. 利用python去除红章
  8. 专家支招:如何利用Plesk搭建完美全能开发环境
  9. [luoguP1029] 最大公约数和最小公倍数问题(数论)
  10. 域控制器的强制卸载,Active Directory系列之十四
  11. easyui汉化啊!
  12. Flash已死,有事烧纸!
  13. @程序员们,华为员工 300 万分红,老板给你多少年终奖?
  14. jquery系列教程3-DOM操作全解
  15. Windows核心编程_在Visual Studio窗口输出调试信息
  16. 助听器声音大了会不会对耳朵有影响
  17. Windows--IOmeter测试网络
  18. android辅助功能截屏,Android 截屏的三种方法
  19. excel 第18讲:lookup函数与数组
  20. H5页面调用微信扫一扫

热门文章

  1. HTML meta 标签总结
  2. RequiredFieldValidator验证下拉列表框
  3. ZT 为什么pthread_cond_t要和pthread_mutex_t同时使用 || pthread/Linux多线程编程
  4. MySQL索引背后的数据结构及算法原理(employees实例)
  5. BZOJ.3990.[SDOI2015]排序(DFS)
  6. 什么是JAP,什么是ORM,与hibernate的关系
  7. 搬砖的也能学Python----if - elif 语句
  8. RESTFUL协议入门介绍
  9. [c/c++] programming之路(12)、循环结构
  10. jQuery 查找父元素